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Cuvant inainte 


Acest curs se adreseaza studentilor Facultatii de Informatica din Universitatea “Alexandru 
loan Cuza” din laşi. El grupează materiale pe care primul autor le-a predat în cadrul cursului de 
Inteligență Artificială de-a lungul mai multor ani, dar şi capitole noi, contribuite de ceilalți doi autori 
foarte recent. Un curs cu acest nume a fost introdus în facultatea noastră în anul 1989, deşi anumite 
module care tin de această disciplină fuseseră predate cu mult timp înainte: astfel prof. Costică 
Cazacu preda de mult timp logica rezolutivă a lui Robinson iar prof. Călin Ignat preda la acea dată 
limbajul Prolog. 

De la an la an acest curs s-a modificat (poate nu întotdeauna către mai bine), pe de o parte 
datorită nestatorniciei domeniului, iar pe de o altă parte, pentru că unui profesor îi e imposibil să 
repete aceleaşi lucruri în doi ani succesivi. Idei vehiculate la cursuri şi notate grăbit, însemnări făcute 
la seminar, copii după cursuri luate de mână de studenți şi cerute lor după ore, toate acestea s-au 
adunat şi au format, în timp, un material semnificativ. Doar de câţiva ani am hotărât să culeg aceste 
materiale în format electronic, întârzâiere care a fost datorată în mare parte descurajării mele în fata 
imensitatii materialelor publicate în acest domeniu. Dar dacă cedezi în fata gândului că orice ai scrie, 
cineva trebuie să mai fi spus acel lucru altundeva, anii trec, studenţii vin şi pleacă şi nimic nu prinde 
contur şi nu rămâne... La un moment dat, totuşi, trebuie să laşi în urma ta o carte. Chiar şi atunci 
când domeniul predat nu coincide cu cel în care iti duci activitatea de cercetare, adică cel în care 
inventezi, încă poți fi scuzat să scrii o carte asupra unui domeniu pe care îl cunoşti (desigur, partial) 
dacă maniera în care îl descrii iti aparține şi dacă, adoptand-o în predare, studenții participă, se 
implică şi se simt bine. Predarea nu-şi are rost decât atunci când este înțeleasă ca un act de creaţie. 
Deşi un violonist nu scrie partitura pe care o execută, felul în care interpretează textul muzical îl 
transformă într-un creator sau, dimpotrivă, îl arată ca fiind un reproducător de duzină. 

Cartea de fata, poate la fel ca multe altele, cu siguranţă n-ar fi existat sau ar fi fost mult mai 
subțire daca aş fi ţinut ca toate ideile redate în ea să fi fost inventate de noi, cei trei autori. Cele mai 
frumoase dintre ideile pe care le-am descris aici au fost inventate de alţii, noi nefiind decât interpreții 
lor, e drept, în propriul nostru stil. Mai toate exemplele însă, cu câteva excepții (cazuri în care am 
menţionat sursele), sunt originale. Cele mai multe dintre ele nu au anvergura unor aplicaţii reale ci 
sunt circumscrise tipului “probleme jucărie”, atât de mult agreate în didactica acestui domeniu. 
Câteva sunt decupate însă din aplicaţii reale şi diminuate până la “jucărioare” uşor de explicat şi 
formalizat. 

In toți aceşti ani de când predau acest curs la Facultate, am avut bucuria să lucrez cu mai 
multi tineri care m-au ajutat la catedră ca asistenţi. Fiecare dintre ei a lăsat urme asupra generațiilor 
de studenți şi, în diverse moduri, probabil, şi asupra acestei cărți. Ei sunt: Andrei Adrian, Amalia 
Todiraşcu, Adrian lftene, Petrică Obreja, precum şi colaboratorii mei actuali, co-autorii, Mădălina 
lonita şi lonut Pistol. Le mulțumesc tuturor, după cum le mulțumesc acelor studenţi ai mei care mi-au 
făcut bucuria să-i reîntâlnesc, la fiecare curs, atenţi şi deschişi să primească noi provocări... 

Capitolele din carte au fost contribuite după cum urmează: capitolele 1-4 — primul autor, 
capitolul 5 — al doilea autor, capitolul 6 — al treilea autor. 


Dan Cristea 
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Capitolul 1 | 
Introducere 


Când un venerabil şi respectat om de ştiinţă spune că un lucru este posibil, 
sigur are dreptate. Cand un venerabil şi respectat om de ştiinţă spune 
că un lucru este imposibil, sigur se înşeală. 


Arthur C. Clarke 


1.1 Definiţia Inteligentei Artificiale şi un pic de istorie 


Luată din Dicţionarul Explicativ al Limbii Române (DEX), definiţia inteligenţei 
pune în evidenţă capacitatea individului de a se adapta şi de a rezolva situații noi pe 
baza experienței acumulate anterior. intuiţia lexicografului a devansat cercetările 
de IA — care doar recent au pus pe primul plan cunoaşterea, deplasând centrul de 
greutate al definiţiei IA către cunoaşterea aplicată. 


Definiţia Inteligenţei Artificiale este data de Barr&Feigenbaum (Barr, 
Feigenbaum, 1981): /A este ştiinţa, parte a informaticii, care proiectează sisteme 
artificiale cu comportament inteligent — adică sisteme ce manifestă proprietăți pe 
care în mod obişnuit le asociem cu existenţa inteligenței în comportamentul uman - 
înțelegerea limbajului, învățare, raționament, rezolvarea problemelor ş.a.m.d. Astfel 
de sisteme pot răspunde flexibil în situaţii ce nu au fost anticipate de programator. 


Precursor al domeniului este considerat Norbert Wiener, care, bazat pe tripla 
formaţie universitară în matematică, zoologie şi filosofie, reuşeşte să găsească în 
cartea sa Cibernetica sau control şi comunicaţie la om şi maşină . Sintagma 
Inteligență Artificială este pronunţată însă pentru prima oară în 1956 la conferinţa de 
la Darthmouth, Canada. 


1.2 Testul Turing 


Introducerea unui arbitru uman într-o dispută având ca scop definirea 
inteligenţei maşinii pare inevitabilă. Dificultăţi de natură filosofică fac imposibilă 
găsirea unei definiţii riguroase a inteligenţei. Odată ce acceptăm un amestec uman 
în această dispută înseamnă că cedăm empiricului, partizanului, subiectivului, adică 
în fapt recunoaştem imposibilitatea de standardizare într-o chestiune care n-ar fi 
existat dacă noi n-am fi existat. Suntem capabili a marca inteligența umană pe o 
scară Q, dar cum putem face distincţia dintre inteligența umană şi cea a maşinii? 

In testul Turing un subiect uman şi o maşină sunt aşezate în camere distincte 
de aceea a unui alt personaj uman, numit arbitru. Arbitrul comunică cu subiectul 
uman şi cu maşina prin intermediul unei tastaturi şi trebuie, prin întrebări adresate 
celor doi, să decidă care din ei e omul şi care e maşina. 

În dilema identificării inteligenței într-o maşină, vom constata că manifestam 
întotdeauna o reţinere în a considera că o maşină e înzestrată cu inteligență, chiar 
dacă răspunsurile ei sunt cele pe care le aşteptăm de la un interlocutor uman, 
pentru că vom fi nesiguri dacă interfaţa spectaculoasă este susținută de o trăire 
psihică adecvată ori este doar o simulare. Un obstacol serios în definirea gradului în 
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care o maşină poate fi considerată inteligentă, va rămâne diferența dintre 
comportament, ce poate fi obiectivat, şi acel ceva adânc, personal şi indefinibil care 
provoacă comportamentul. 

Plasată în condiţii de test diverse, până la urmă inteligenţa poate fi decantată 
de fals. Apoi IA este un domeniu foarte adânc ancorat într-o realitate pragmatică. 
Ceea ce interesează în fapt este ca maşina să fie capabilă să înlocuiască nişte 
sarcini care în mod normal presupuneau prezența omului. Aceste sarcini sunt 
adesea foarte bine precizate de un cadru al aplicaţiei şi, deocamdată, nu se cere 
maşinii un comportament universal inteligent. 


1.3 Probleme de natură filosofică şi pragmatică 


Testul Turing — pentru prima oară publicat în revista Mind, în 1950. Există o 
competiție anuală (http://www.cogsci.ucsd.edu/-asaygin/tt/ttest.html). Dificultatea principală 
constă în încorporarea cunoaşterii de bun-simt (common-sense knowledge) în 
maşină. 

Dar testul Turing este contestat de anumiţi teoreticieni ai domeniului ca fiind 
relevant pentru a defini inteligența maşinii. Ei argumentează că o maşină care ar 
trece acest test nu ar manifesta inteligenţă în aceeaşi manieră în care un om ar 
manifesta-o. Testul Turing nu dă decât o privire superficială asupra inteligenţei, 
utilizând un criteriu distinctiv pur pragmatic, pe când adevărata inteligență e de 
natură adânc semantică. O maşină care ar trece testul Turing se spune că ar 
manifesta inteligenţă artificială slabă (weak Al). 

Penrose (Penrose, 1998) nu crede că inteligență adevărată poate fi cu 
adevărat prezentă fără conştiinţă şi de aici că inteligenţa nu va putea fi niciodată 
produsă de nici un algoritm ce e executat pe o maşină. El enunţă patru puncte de 
vedere ce pot fi identificate relativ la problema realizării inteligenţei pe o maşină. 


Punctul de vedere mecanicist, sau al inteligenţei artificiale tari, confundă 
gândirea cu calculul. Mai mult decât gândirea, ca manifestare logică a unui creier, 
toate trăirile care implică constiinta reprezintă rezultate ale unor calcule. La una din 
extremele acestui punct de vedere întregul univers e privit ca un imens calculator, 
mintea omenească reprezentând doar una din componentele acestui proces de 
calcul. Faptul că însăşi substanța pare a se raporta din punct de vedere 
computaţional la energie (conform formulei lui Einstein E=mc?) întăreşte acest punct 
de vedere după care fenomenele ce se desfăşoară în celulele creierului pot fi 
gândite matematic, deci simulate pe un alt mediu computaţional decât cel original. 
Cum toate manifestările interne ale unui creier ar putea fi reproduse pe o maşină 
care efectuează calcule, atunci ar trebui să acceptăm că până şi manifestările 
interne — conştiinţa însăşi — ar putea fi redate pe o maşină. In esenţă dispare 
diferenţa dintre conştiinţă şi simularea ei, tot ceea ce se poate petrece pe o maşină 
performantă este adevăr în aceeaşi măsură în care adevăr reprezintă trăirile noastre 
adânci, sentimentele, bucuriile şi durerile noastre, ideile pe care le avem ori 
înțelegerea pe care credem că o avem fata de o opera de artă sau o bucată 
muzicală. In conformitate cu acest punct de vedere testul Turing este absolut 
relevant în depistarea inteligenţei artificiale, dacă o maşină răspunde adecvat la 
întrebări înseamnă că şi înțelege acele întrebări şi răspunsurile ei sunt în rezonanţă 
cu procese mentale de profunzime pe care aceste întrebări le inspiră. 
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Punctul de vedere al inteligentei artificiale slabe accepta din nou constiinta 
ca rezultat al actiunilor fizice ale creierului si faptul ca orice actiune fizica poate fi 
reprodusă computational, dar simularea computationala nu trezeşte sau nu 
presupune şi constiinta. Spre deosebire de punctul de vedere mecanicist un robot 
care trece testul Turing in mare masura simuleaza intelegerea fara ca aceasta sa 
aibă cu adevărat loc, la nivelul reacţiilor o persoană şi o maşină se manifesta la fel, 
dar maşina simulează conştiinţa, o raportează doar, pe când o ființă o 
experimentează. Simularea computationala a unui proces este un lucru complet 
diferit de procesul însuşi (Searle, 1992). Searle (Searle, 1980) imaginează un 
experiment capabil să demonstreze că un calculator nu are aceeaşi înțelegere ca un 
om: conceptul de cameră chinezească. In acest experiment se presupune existența 
unui calculator supersofisticat capabil să „înţeleagă” (în orice acceptiune posibilă a 
acestui termen) un text în chineză şi să răspundă la întrebări legate de acesta. 
Textul şi apoi întrebările sunt prezentate maşinii ca şiruri de caractere chinezeşti pe 
cartonaşe, iar răspunsurile acesteia sunt tipărite şi prezentate în aceeaşi manieră. In 
faza a doua a imaginarului experiment, intervine un individ superdotat, programator, 
care nu ştie o iota chinezeste. Lui i se prezintă programul maşinii şi i se cere să-l 
aplice pentru a obține, el însuşi, acelaşi rezultat. După mai mult timp, în care acesta 
desluşeşte programul maşinii, el va fi capabil să obțină aceleaşi rezultate ca şi 
maşina. Problema este aşadar următoarea: faptul că individul uman este acum 
capabil să răspundă corect unor întrebări puse într-o limbă pe care el nu o vorbeşte, 
relative la un text prezentat în aceeaşi limbă, ne poate face să spunem că el „a 
înțeles” acel text şi acele întrebări? E posibil să credem că atât maşina cit şi individul 
din experimentul lui Searle ar fi trecut testul Turing (în sensul că, plasat în locul 
calculatorului şi deci întrecându-se cu un individ care ştie chinezeşte, arbitrul nu l-ar 
fi putut demasca). Şi totuşi accepțiunea lui „a înțelege chinezeste” este evident una 
particulară aici. În enunţul experimentului său Searle reduce problematica la 
prelucrări dibace de şiruri de caractere chinezeşti. Dintr-un anumit punct de vedere, 
care se concentrează strict asupra unei perechi de cartonase intrare-iesire, într- 
adevăr avem de a face cu prelucrări de caractere. Conştient sau nu, în formularea 
experimentului camerei chinezeşti Searle nu insistă asupra faptului că pentru a 
obține performanţele de prelucrare descrise programul trebuie să se ridice de la date 
prezentate sub formă de şiruri de caractere la concepte. Doar transformarea şirului 
de caractere chinezeşti din intrare în concepte (care sunt independente de o limbă 
sau alta), urmat de capacitatea de a opera cu acestea şi de a transpune din nou 
conceptele în şiruri de caractere prezentate în ieşire, ar fi putut face posibilă 
obținerea unui rezultat de acest fel. Numai că această ridicare de la nivelul de 
prelucrare al şirurilor de caractere la cel al unei prelucrări de tip conceptual nu 
schimbă cu nimic concluzia. Pentru că în definitiv şi conceptele pot fi etichetate cu 
şiruri de caractere. 


Punctul de vedere realist (imbratisat de Penrose, ca şi de mine) nu acceptă 
nici măcar posibilitatea unei reproduceri realiste a conştiinţei. Mai devreme sau mai 
târziu, dacă dialogul continuă, maşina trebuie să se dea de gol. Efectele externe ale 
conştiinţei nu pot fi simulate corespunzător. Există manifestări ale conştiinţei care nu 
pot fi explicate prin legile actualmente cunoscute ale fizicii şi, ca urmare, nu pot fi 
reproduse computaţional. Nu este nici un fel de fetişism în acest punct de vedere. 
Pentru mai multe detalii cititorul este îndemnat să consulte cartea lui Penrose. 
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În sfârşit, punctul de vedere mistic este cel conform căruia conştiinţa nu 
poate fi explicată în termeni fizici, ştiinţa e neputincioasă în tentativa de a explica 
conştiinţa. Cu toată aparenta identitate dintre aceste două ultime puncte de vedere, 
există totuşi o mare diferenţă între ele: ultimul neagă a-priori capacitatea ştiinţei de a 
cunoaşte conştiinţa, pe cand cel realist afirmă că problema conştiinţei conştiente 
este una stiintifica şi doar incapacitatea noastră momentană nu ne permite să o 
pătrundem deplin. 


În ciuda dificultăţilor de a identifica inteligenţa artificială cu cea naturală, 
există puternice motivații de natură pragmatică pentru realizarea de sisteme cu 
comportament inteligent sau apropiat de cel inteligent. Aşadar, mai puţin aplecat 
asupra detaliilor demonstrațiilor filosofice, domeniul IA este complet absorbit de 
practică. Acest lucru se observa cu predilecție în apelul la proiecte de cercetare in 
domeniul tehnologiei informaţiei (Information and Science Technology - IST) din 
cadrul programului cadru 6 (framework program 6 — FP6) al Comisiei Europene, 
lansat în decembrie 2002 (v. situl web http:/www.cordis.lu). 


1.4 Subdomenii ale inteligenței artificiale 


Prelucrările simbolice (symbolic processing) reprezintă componenta cu 
preocupări de programare a domeniului. Ea a dus la dezvoltarea unor limbaje 
specializate în prelucrarea simbolurilor, cel mai cunoscut dintre ele fiind Lisp. Fără a 
neglija aspectele clasice ale programării, cum ar fi utilizarea numerelor în calcule, în 
toate aceste limbaje se pune un accent deosebit pe manipularea simbolurilor. Un 
limbaj adecvat prelucrărilor simbolice găzduieşte cu uşurinţă reprezentarea şi 
manipularea simbolurilor de orice natură, nu numai numerice. Pentru că inteligenţa 
artificială se bazează în mare măsură pe manipularea simbolurilor, Lisp este 
considerat limbajul de casă (sau nativ) al inteligenţei artificiale. Un tip particular de 
prelucrări simbolice sunt confruntările de şabloane (pattern matching). Şabloanele 
sunt obiecte abstracte formate din parti definite riguros şi altele doar schitate. 
Şabloanele sunt utilizate pentru regăsirea de obiecte ce satisfac anumite 
constrângeri în mulţimi de obiecte asemănătoare. 


Procesare simbolică şi limbaje de procesare simbolică. În general se 
accepta că sistemele inteligente din natură prelucrează două tipuri de informaţii: de 
natură simbolică sau concentrată şi de natură difuză, distribuită. Calculatoarele 
noastre, prin proiectare, sunt destinate a manipula numere şi caractere, având 
compartimente special proiectate pentru realizarea performantă de calcule 
numerice. Lucrul cu simboluri (şiruri de caractere, imagini sau sunete) deşi realizabil 
pe calculatoarele clasice, necesită tehnici speciale mulate pe natura digitală a 
aparatului de calcul. Maşina uzuală pe care o avem la dispoziţie nu are cablate 
disponibilitati de a opera cu simboluri, de a realiza regăsiri simbolice pe bază de 
asociaţii, ori de a forma alti simboluri prin compunere. Manipularea simbolurilor 
necesită un aparat logic si un suport adecvat de calcul (o maşinărie). Aparatul logic 
este dat de logica simbolică care reprezintă atît un model de formalizare a 
cunoştinţelor cît şi o metodă de raționament. Maşinăria este asigurată de limbajele 
de procesare simbolică capabile a simula un comportament adecvat prelucrărilor 
simbolice mulat pe natura slab simbolică a maşinii. Dintre acestea, putem identifica: 
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Lisp — în paradigma funcţională, Prolog — în paradigma logică si Clips — în 
paradigma bazată pe reguli". 


Reprezentarea cunoaşterii (knowledge representation). Putem interactiona 
cu mediul înconjurător pentru că, pe de o parte, datorită simţurilor, intrăm în legătură 
cu ea, iar pe de altă parte o "înțelegem" aşa cum este. Ca sa înțelegem realitatea 
avem însă nevoie de a o "proiecta" în mintea noastră. Această proiecţie este o 
reprezentare a realității. Fără a avea o reprezentare asupra unei entități nu putem 
emite judecăţi asupra ei. Reprezentarea implică, în principiu, trei componente: o 
notație, o denotatie şi un calcul. Notatia este un desen, sau o structură de date, care 
respectă anumite convenții (date de obicei de o sintaxă). Conotatia, sau semantica, 
este interpretarea pe care o dăm notatiei, din nou pe baza unui sistem de convenții. 
Fără aceste reguli de interpretare notația este superflua. In sfârşit o reprezentare 
trebuie să includă un model computaţional care să facă posibilă operarea cu 
obiectele şi relaţiile dintre obiecte ce compun reprezentarea. Datorită modelului de 
calcul entitățile modelate prind viata, putându-se studia astfel comportamentul lor în 
condiţii ce simulează de aproape realitatea. 


Rationament automat şi demonstrarea teoremelor (theorem proving, 
problem solving). Cea mai veche ramura a IA si cea mai teoretica dintre ele, 
utilizează logica ca sistem formal de găsire a demonstrațiilor şi de generare a 
inferentelor automate. Foarte multe probleme pot fi formalizate ca probleme de 
matematică sau logică, rezolvarea lor reducându-se la o demonstrare a unei 
teoreme plecând de la un sistem de axiome şi utilizând un mecanism de deducție 
logică. Ca şi în alte cazuri, dificultăţile rezidă în numărul extrem de mare de 
posibilităţi ce pot apare. Pentru controlul exploziei de posibilități în căutarea unei 
soluţii se utilizează de multe ori soluţii euristice, care deşi nu garantează soluția 
optimă, pot în general duce la găsirea uneia, cel puţin. 


Înțelegerea limbajului natural (natural language processing). Este de mult 
acceptat că utilizarea limbajului este o caracteristică definitorie a inteligenţei. Desi 
nouă ne vine atât de uşor să comunicăm prin limbaj, o încercare de explicitare a 
mecanismelor care stau la baza înţelegerii textelor ori a limbajului vorbit se 
dovedeşte deosebit de dificilă. În domeniul înţelegerii limbajului natural trebuie întîi 
stabilită o distincție între a înțelege un mesaj comunicat prin voce şi a înțelege un 
mesaj scris. De prima chestiune se ocupă domeniul de cercetare al interpretării 
vorbirii (speech processing). Problema înţelegerii limbajului — în varianta scrisă — 
face obiectul a două tipuri de preocupări. Lingvistica computationala pe de o parte, 
ca domeniu pur academic, pune în discuţie modele computationale ale limbajului 
natural cu scopul de a investiga şi descoperi natura însuşi a limbajului şi a abilităților 
cognitive umane. Ingineria Lingvistică (sau în varianta predominant americana, 
Tehnologia Limbajului Uman), pe de altă parte, este preocupată de a dezvolta 


1 Paradigmele de programare sunt stiluri ori precepte generale de programare transpuse în caracteristicile 


unor limbaje. Astfel în cadrul paradigmei imperative se clasifică limbajele bazate pe comenzi, paradigma 
funcțională pune la baza programării noțiunea matematică de funcție ideea de bază fiind că un program 
înseamnă un apel de funcție, paradigma orientată obiect aduce în prim plan noțiunea de obiect înzestrat cu 
proprietăți si metode, paradigma logică realizează un program ca o demonstrație de teoremă, în paradigma 
bazată pe reguli un program reprezintă o colecție de reguli si un motor aplică aceste reguli într-o anumită 
ordine. 
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aplicatii care se bazeaza pe utilizarea limbajului natural, orientate spre industrie, 
comerţ, sfera socialului sau cea educațională’. 


Vederea artificială (vision). Cinci simţuri” (vederea, auzul, simţul tactil, 
mirosul şi gustul) ne stau la dispoziţie pentru a interactiona cu mediul, pentru a lua 
cunoştinţă de ceea ce se află în afara corpului nostru, în imediata noastră 
vecinătate. Pentru a ne prelungi "bătaia" acestor simţuri am inventat aparate care ne 
ajută să vedem ori să auzim la distanță. Modelarea acestor simțuri pe sisteme 
automate reprezintă cu certitudine, o preocupare de mare însemnătate a domeniului 
IA. Dintre cele cinci, vederea ocupă un loc privilegiat. Sistemele de vedere artificială 
încearcă să descifreze mecanismele vederii şi ale interpretării imaginilor statice şi în 
mişcare. 


Planificare şi robotică (robotics). Sistemele inteligente vii au abilitatea de a 
găsi soluţii de deplasare în spaţiu în vederea atingerii unor obiective sau de mutare 
a unor obiecte folosind braţele. Căutarea unui drum pe un teren accidentat (lunar, de 
exemplu, sau pe fundul oceanelor) sau într-un spațiu presărat cu obstacole (cum 
este o cameră) nu este o problemă simplă, nu în ultimul rând datorită numărului 
mare de posibilități de alegere la fiecare pas, complexitate ce face imposibilă 
tentativa căutării exhaustive. Incercand a modela procesele cognitive care se 
desfăşoară în sistemele vii, planificarea roboților este un câmp de cercetare care 
urmăreşte a îmbunătăţi comportamentul roboților atunci cand ei sunt programati a 
executa diferite sarcini. 


invatare automata (/earning). Un sistem inzestrat cu inteligenta este capabil 
să învețe pentru a-şi îmbunătăţi interacţiunea cu mediul. El poate învăţa fie din 
greşeli, prin auto-perfectionare, fie ghidat de un profesor, fie generalizand, fie prin 
analogie, sau din exemple pozitive şi negative. Domeniul învăţării automate 
formalizează aceste metode şi caută aplicarea lor la sistemele automate. 


Sisteme expert (expert systems). Puterea stă în cunoaştere. Aplicarea 
acestui truism în sisteme artificiale înseamnă dotarea lor cu abilitatea de a se servi 
de cunoaştere specifică (cunoaştere expert). Un medic este bun în găsirea unui 
diagnostic pentru că are un bagaj de cunoştinţe generale dar şi specifice despre boli 
şi bolnavi. Partial această cunoaştere a deprins-o din cărţi, partial în cursul anilor de 
experienţă clinică, prin atâtea cazuri în care s-a implicat. Achiziţionarea, 
formalizarea şi includerea cunoaşterii expert în sistemele artificiale reprezintă scopul 
domeniului Sistemelor Expert. Cursul nostru va dezbate cu precădere probleme de 
această natură. 


? Definiţiile sunt preluate dintr-un recent mesaj difuzat pe lista corpora@hd.uib.no de Prof. Geoffrey 


Sampson, School of Cognitive & Computing Sciences, University of Sussex, care la rândul său citează un 
articol publicat într-un număr recent al revistei Natural Language Engineering. 

Cercetări noi lasă speranţa că vom învăţa să ne servim de încă alte simţuri din sfera para-normalului, ce la 
majoritatea dintre noi sunt de utilitate subliminală, dar pentru care alții manifestă o dotare aparte. 
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1.5 Probleme şi soluții IA fata de probleme şi soluții de programare 
clasică 


1.5.1 Prin ce diferă o problemă clasică de una de IA ? 


Există o seamă de trăsături care diferențiază câmpul IA de alte domenii ale 


informaticii (computer science). Cursul de fata încearcă să convingă cititorul ca 
măcar următoarele trăsături pot fi considerate definitorii: 


Ce face ca o problemă să fie considerată de IA, iar o alta nu? 
- problemele de IA necesită in general un raționament predominant simbolic; 


- probleme care îmbie la investigaţii IA sunt şi cele care manipulează informatie 
incompletă ori nesigură; 


Ce face ca o soluţie să fie considerată ca fiind caracteristică metodelor IA? 


- de cele mai multe ori nu este de natură algoritmică. Adesea, ea este obținută 
în urma unei căutări într-un spaţiu al soluțiilor posibile; 


- soluţiile ce se cer nu trebuie cu necesitate să fie cele mai bune sau exacte. 
Uneori e suficient dacă o soluție este găsită, sau dacă o formulare 
aproximativă a ei este obţinută; 


- in rezolvarea problemelor de IA adesea intervin cantităţi foarte mari de 
informaţii specifice. Găsirea unui diagnostic medical nu poate fi algoritmizat 
pentru că diferenţele de date asupra pacientului incumbă tipuri însuşi de 
soluţii diferite. De aceea doctorii spun că nu există boli şi doar pacienți; 


- natura cunoaşterii ce se manipulează în problemele de IA poate fi uşor 
departajată în procedurală şi declarativă: este diferenţa dintre cunoaşterea pe 
care o posedă cu păianjen şi un inginer constructor de poduri, sau diferența 
dintre cunoaşterea pe care o posedă un jucător de tenis şi un bun antrenor. 
Cunoaşterea unuia se află ‘in vârful degetelor, a celuilalt într-un sistem de 
reguli. 


Pot probleme de IA fi rezolvate prin algoritmi clasici ? 
- Cu siguranţă că da, dar soluţiile vor fi probabil greoaie, greu generalizabile, 
nefiresti şi neelegante. 


Invers: pot probleme clasice fi rezolvate prin metode ale IA ? 
- Iarăşi lucrul este posibil, dar e ca şi cum am folosi un strung ca să ascutim un 
creion. 


De ce un program de calcul al salariilor nu este un program de IA pe când a face un 
robot să măture prin casă fără a distruge mobila, sau a face un program să 
recunoască figuri umane este o aplicaţie de IA? 


Distincția dintre cunoaşterea procedurală şi cea declarativă. Trăsături ale cunoaşterii 


declarative: 


poate fi schimbata mai rapid si mai usor pentru ca este de natura discreta; 
poate fi folosita la mai multe scopuri decat la cel imaginat initial; 
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e poate fi extinsă prin procese de raţionament care adaugă cunoaştere noua; 
e poate fi accesată de programe de introspectie care să ofere explicaţii la cerere. 


Nivelul actual al cercetărilor şi realizărilor în IA 


Exemple de direcții de cercetare particulare în IA: 

> sisteme inteligente pentru biologie moleculară (pana în 1997 — s-au ţinut 5 
conferinţe internaţionale pe această temă, începând din 93); 

> roboţi inteligenţi — competiţii de roboți inteligenţi (primul ţinut la San Jose, 
California, în 1992, în 1996 —a 5-a ediţie, in Portland, Oregon). 

e sisteme expert (medicină, chimie, geologie, configurarea sistemelor de calcul, 

descoperirea legilor fizicii); 

raţionament automat, demonstrarea de teoreme; 

verificarea programelor; 

matematică simbolică (calcul diferenţial, integral, manipularea expresiilor); 

jocuri (şah, table, checkers) 

interfeţe în limbaj natural la baze de date şi de cunoştinţe; 

sisteme de întrebare-răspuns pe domenii limitate sau largi; 

sisteme de traducere automată; 

senzori inteligenţi; 

controlul roboților stationari şi mobili (linii de asamblare, roboți subacvatici sau 

spatiali). 


Cerinte pentru studenti 

e Sa cunoască semnificaţia şi detaliile testului Turing. 

e Să cunoască definiția domeniului IA şi cu ce se ocupă subdomeniile sale. 
e Sa poată distinge o problemă de IA de una clasică. 
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Capitolul 2 | 
LISP 


Mintea funcţionează ca o parasuta: e utilă doar cand e deschisă. 


Lord Thomas Dewar 


2.1 Introducere 


Intenţia acestui capitol nu este aceea de a da o descriere exhaustivă a 
limbajului LISP ci de a introduce noțiunile esenţiale ale lui, care să facă posibilă 
scrierea de aplicaţii simple la capitolele de inteligenţă artificială ce urmează. Nu 
vrem ca prezentarea să urmărească cu necesitate un anumit dialect de Lisp. Toate 
exemplele noastre vor putea însă fi rulate direct în Allegro Common Lisp, versiunea 
de Common Lisp creată de Franz Inc. (www.franz.com). Common Lisp (Steele, 1990) 
este dialectul pe care l-a dezvoltat Comisia de standardizare a Lisp-ului X3J13 din 
cadrul ANSI (American National Standard Institute). Datorită flexibilitatii deosebite a 
limbajului, care parcă invită la implementări aventuroase, procesul de standardizare 
a fost unul de durată, dar după anul 1990 a fost finalizat în varianta care este 
acceptată astăzi de cele mai multe implementări Common Lisp. 


Lisp — limbajul proiectat special pentru problema pe care o am de rezolvat 


Dacă ar fi să inventăm o reclamă pentru promovarea limbajului Lisp, ar trebui, 
probabil, să ne exprimăm astfel: 

+ Lisp este limbajul care găzduieşte, cu simplitate şi eleganţă, conceptul de 
prelucrare a datelor cunoscut sub numele de prelucrare simbolică. Fără a 
neglija calculul numeric, limbajele simbolice au facilităţi speciale de a lucra cu 
simboluri nenumerice. 

+ Lisp este unul dintre limbajele care exemplifică paradigma de programare 
funcțională“. O funcţie este un obiect matematic care întoarce o unică 
valoare pentru un set de valori date în intrare. Toate construcțiile unui limbaj 
functional pur sunt functii care întorc valori atunci când sunt evaluate. Lisp, ca 
şi multe dintre suratele lui funcţionale, a acceptat însă şi efecte laterale în 
evaluarea funcţiilor, care deşi l-au impurificat i-au mărit expresivitatea. 

+ Lisp este limbajul care se mulează pe problema pe care o aveţi de 
rezolvat. Această afirmaţie trebuie înțeleasă în sensul ergonomiei 
excepţionale pe care o oferă limbajul actului de programare. Programarea în 
Lisp este, pentru un cunoscător, o plăcere, un spectacol şi o invitaţie la 
creaţie. Programarea în Lisp este uşoară iar productivitatea limbajului este 
remarcabilă. Lispul este adesea mai concis decât alte limbaje. 


* Alături de Erlang — pentru aplicaţii concurente, R — pentru prelucrări statistice, Mathematica — 


pentru matematică simbolică, APL — cunoscut mai ales pentru facilităţile de a opera cu matrici, 
extensia ulterioară a acestuia J, K — pentru analiză financiară, XSLT — pentru transformarea 
documentelor XML, cât şi limbajele noi ML (al lui Robin Milner), cât şi Miranda (David Turner) şi 
urmaşul acestuia Haskell (dezvoltat de Haskell Curry). 
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e Lisp este limbajul care se dezvoltă pe măsură ce rezolvati problema. 
Această trăsătură provine din utilizarea macrourilor — secvenţe de cod ce 
suportă execuţii specială. Prin macrouri se poate da nu numai o noua 
interpretare noțiunii de evaluare a formelor limbajului, ci se poate schimba 
însăşi sintaxa. Se pot crea în acest fel linii de cod care nu mai seamănă deloc 
cu sintaxa obişnuită a limbajului. 

+ Lisp este un limbaj specializat pentru prelucrarea listelor, ceea ce se 
reflectă în chiar numele lui (LISt Processing). Motivul pentru care lista, o 
structură de date relativ nespectaculoasă, poate sta la baza unui limbaj 
dedicat dezvoltării de aplicaţii într-un domeniu atât de pretentios precum 
inteligenţa artificială este că această structură este extrem de generală, o listă 
putând inlantui nu numai simboluri precum numere şi cuvinte ci şi alte liste, 
oferind posibilitatea reprezentării de o manieră uniformă a unor structuri oricât 
de complicate. 

e Lisp este limbajul „de casa” al inteligenței artificiale. Caracteristicile ce-i 
conferă această calitate sunt: facilitatea de a lucra cu simboluri, lista — ca 
structură fundamentală de date, mecanismele complexe de evaluare şi 
utilizare a macrourilor, care pot duce la construcţii procesuale sofisticate şi 
care se comportă diferit în funcţie de context. 


Lisp facilitează o abordare multi-strat în programare. Implementarile orientate- 
obiect ale acestui limbaj îi conferă toate trăsăturile cunoscute ale paradigmei. In mod 
particular, programarea multi-strat înseamnă construcţia de straturi de definiţii 
funcționale, ceea ce invită la o abordare bottom-up în rezolvarea problemelor, în aşa 
fel încât apelurile de la un nivel superior să incorporeze definiţii de funcții şi 
construcții de pe un nivel inferior. 

Programarea multi-strat este cu deosebire o abordare care se pretează 
dezvoltării proiectelor mari, care necesită lucru în echipă, uneori conlucrarea mai 
multe echipe. Aşa cum se sugerează în Figura 2.1, într-o abordare de jos în sus, se 
pleacă de la un nivel de bază pentru a se construi deasupra lui un număr de niveluri 
derivate. Pe nivelul de bază se află diferite componente ale problemei care trebuie 
rezolvată într-un anumit limbaj de programare. Prin utilizarea posibilităților oferite de 
limbaj se creează deasupra acestuia un prim nivel de instrumente ori funcții, 
capabile să facă fata cerinţelor problemei şi, eventual, chiar să le depăşească. Acest 
nivel poate fi văzut ca un alt limbaj, superior celui aflat la bază. In acelaşi mod, 
nivelurile superioare se creează deasupra celor imediat inferioare, până la atingerea 
specificaţiilor proiectate. 

În particular, Lisp-ul invită nu numai la crearea unor limbaje de nivel 
intermediar bazate pe definiţii de funcţii şi în care construcţiile să rezulte prin 
manipularea apelurilor, ci inclusiv la inventarea unor sintaxe speciale care să se 
integreze cerinţelor nivelurile de proiectare respective. 

Invers, într-o abordare de sus în jos, se pleacă de la o proiectare iniţială a 
soluţiei. Această soluție, definită în termeni generali, face apoi obiectul unor 
rafinamente succesive, până la rezolvarea efectivă a problemei. Dificultatea într-o 
astfel de abordare constă în centrarea proiectului iniţial pe soluţie fără a se scăpa 
din vedere aspecte ce ar putea să o facă neaplicabilă pe unele cazuri speciale — 
„capetele problemei”. Intr-o astfel de deplasare nefericită nu deranjează acoperirea 
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unor aspecte neavute in vedere initial ci neacoperirea altora care sunt esentiale in 
rezolvarea problemei. 


cazuri neprevazute in proiect, 
posibil a fi acoperite de solutie 


cazuri prevăzute în proiect dar 
neacoperite de soluție 


l cazuri prevăzute in proiect si 


proiectarea de jos în sus proiectarea de sus in jos acoperite de solutie 


Figura 2.1: Crearea programelor bottom-up fata de top-down 


2.2 Functii, maniere de definire si apel 


2.2.1 Transparenta referentiala 


Spunem ca o functie este transparenta referential daca valoarea intoarsa de 
ea depinde numai de parametrii pe care i-a primit în intrare. Astfel, dacă scriem în 
limbajul C: 


function fool (x) 
{ return (x+2); 


) 


valoarea întoarsă de funcţia foo1 depinde, la orice apel al ei, numai de valoarea 
intrării x. Dacă însă o transformăm în: 


int a=2; 


int function foo2(int x) 
{ return (xta); 


} 


atunci valoarea întoarsă de foo2 la un apel al acesteia de forma foo2 (3), de 
exemplu, depinde nu numai de valoarea intrării x, care este 3 în cazul de fata, ci şi 
de a variabilei globale a (2 în cazul de fata). Spunem deci ca fool este 
transparentă referential în timp ce foo2 — nu. 


2.2.2 Efectul lateral 


Se spune că o funcţie are un efect lateral dacă evaluarea ei adaugă 
contextului şi alte modificări decât strict valoarea întoarsă de funcţie. Astfel, funcţia 
fool definită mai sus nu are efecte laterale, în timp ce funcţia foo3 de mai jos, are: 


int a; 


function foo3(int x) 
{ a := x+2; 


15 


Cristea, Ionita, Pistol — Inteligența Artificială 


return (a); 


) 


pentru că, în afara valorii întoarse, ea mai provoacă asignarea unei valori variabilei 
globale a. 


2.2.3 De la notația lambda la Lisp pur 


Lisp este unul dintre cele mai vechi limbaje de programare aflate încă în largă 
utilizare (numai FORTRAN este mai vechi decât el). Primele specificaţii ale 
limbajului au fost elaborate de John McCarthy, în 1958 şi publicate în 1960 
(McCarthy, 1960), pe baza calculului-2 dezvoltat de Alonso Church (Church, 1941) 
şi a unor dezvoltări precedente ce au aparţinut în principal lui Herbert Simon şi Allen 
Newell (Logic Theory Machine şi General Problem Solver, programe dezvoltate în 
limbajul IPL inventat de Newell). 


În notația lambda, într-o definiţie de funcţie se pun în evidență parametrii 
formali ai funcţiei şi corpul ei: 


A(x) = x+2; 


sau: 


(xy) = x+y; 


A 


Într-o astfel de notație funcţiile nu au nume. Asocierea unui nume funcţiilor, în 
vederea creării posibilității de apel al lor, trebuie făcută explicit: 


function f: A(x) = x+2; 
function g: A(x,y) = x+y; 


Într-un apel de funcție trebuie să apară numele ei urmat de o listă de parametri 
actuali: 


f (3) 
g(5,1) 


Un apel poate, in anumite condiţii, să amorseze un proces de evaluare care 
să ducă la generarea unui rezultat. In evaluare se disting două faze: prima în care 
parametrii formali ai funcţiei sunt legaţi la valorile corespunzătoare ale parametrilor 
actuali din corpul definiției funcţiei şi a doua în care are loc evaluarea expresiei astfel 
obținute a corpului funcţiei. In evaluarea corpului pot să intervină alte apeluri de 
funcţie, care se derulează în aceeaşi manieră. Astfel se pot apela funcţii în funcții. 

Spunem că un apel poate, în anumite condiţii, porni un proces de evaluare, 
pentru că o scriere precum f (3) nu garantează efectuarea evaluării. Ea nu este 
decât o simplă notație până ce se comandă explicit unui evaluator (uman sau 
maşină) începerea unui astfel de proces: 
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g(£(3),1) >>> g(5,1) >>> 6 
unde >>> trebuie citit „se evaluează la”. 


Între caracteristicile esenţiale care definesc aşa-numitul Lisp pur se numără 
faptul că funcţiile sunt transparente referential, că funcţiile nu au efecte laterale şi ca 
din limbaj lipsesc asignările. 


2.2.4 Evaluarea numerică fata de evaluarea simbolică 


Fie funcția £ definită mai sus. Apelată asupra parametrului 3 avem o evaluare 
numerică: 


£(3) >>> 3 + 2 >>> 5 


Daca insa parametrul actual care ia locul parametrului formal x din corpul definitiei 
functiei este unul nenumeric, sa zicem a, atunci avem de a face cu o evaluare 
simbolica: 


f(a) >>> at 2 
pentru ca forma rezultata contine un simbol nenumeric. 


2.2.5 Beneficiile unui Lisp impur: Common Lisp 


Pe considerente de creştere a puterii de expresie a limbajului şi de mărire a 
productivităţii activităţii de programare, Lisp-ul pur a fost ulterior impurificat în 
absolut toate direcţiile posibile, fără însă a pierde, prin aceasta, sclipirea de geniu 
originală. Astfel, după cum vom constata în cele ce urmează, s-au acceptat definiţii 
de funcţii care să nu mai respecte trăsătura de transparenţă referentiala (fără a le 
face însă astfel opace referential...), s-au încurajat efectele laterale, s-au adoptat 
câteva operaţii de asignare, ba chiar s-a permis ca o funcţie să întoarcă mai mult 
decât o unică valoare, această din urmă „trădare” făcându-se însă, aparent 
paradoxal, fără să se încalce câtuşi de putin definiția matematică a funcţiei (o 
corespondenţă de la un domeniu de intrare la un domeniu de ieşire în care oricărei 
valori de intrare îi corespunde o singură valoare de ieşire). 


2.3 Tipuri de date în Lisp 


Schema următoare face o clasificare a celor mai uzuale tipuri de date în Lisp: 


s-expresie (expresie simbolică — symbolic expression) 
atom 
numeric 
întreg 
rational (fractie) 
real 
complex 
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nenumeric (în fapt atom literal, noi îi vom numi atom simbolic sau, 
simplu, simbol) 
listă 
listă simplă 
listă cu punct 


şir (array) 
şir de caractere 
tablou (cu oricâte dimensiuni) 


tabelă de asociaţie (hash table) — structură de date care permite asocierea şi 
regăsirea cu uşurinţă a valorilor ataşate simbolurilor; 


pachet (sau spaţiu de nume) — colecţii încapsulate de simboluri. Un parser Lisp 
recunoaşte un nume prin căutarea lui în pachetul curent; 


flux de date — sursă de date, tipic şir de caractere, utilizată pentru canalizarea 
operaţiilor de intrare/ieşire. 


Numai datele au tipuri. O variabilă în Lisp nu are definit un tip. Ea poate primi 
ca valoare orice tip de dată. 


2.3.1 Construcţiile limbajului 


În Lisp operăm cu următoarele categorii de obiecte: variabile, constante, 
date, funcţii, macro-uri şi forme speciale (la acestea mai trebuie adăugate clasele şi 
metodele în implementările orientate-obiect). 

Variabilele sunt asociaţii între simboluri utilizate în anumite spaţii lexicale ale 
limbajului şi valori asociate acestora. După cum vom vedea mai departe, există trei 
moduri prin care o variabilă poate să primească valori, uneori chiar mai multe odată: 
prin asignare, prin legare şi prin intermediul listelor de proprietăţi. Două dintre aceste 
moduri de a primi valori (asignarea şi listele de proprietăţi) sunt caracteristice 
oricărui simbol Lisp. Ceea ce diferenţiază un simbol lexical de o variabilă sunt numai 
situaţiile în care variabilele pot fi legate la valori. 

Constantele sunt simboluri (în general ale sistemului) care au ataşate valori 
ce nu pot fi modificate. 

In Lisp nu există proceduri ci numai funcţii, în sensul că orice rutină întoarce 
obligatoriu şi o valoare. Macro-urile sunt funcţii care au un mecanism de evaluare 
special, în doi paşi: expandarea şi evaluarea propriu-zisă (prezentate în secțiunea 
2.6 Macro-uri). Formele speciale sunt funcţii de sistem care au, în general, o sintaxă 
şi un comportament aparte. 


2.3.2 Un pic de sintaxă 

Următoarele caractere au o semnificaţie specială în Lisp: 
(— o paranteză stângă marchează începutul unei liste; 
) — o paranteză dreaptă marchează sfârşitul unei liste; 


” — un apostrof, urmat de o expresie e, "e, reprezintă o scriere condensată pentru 
un apel (quote e); 
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; — punct-virgula marchează începutul unui comentariu. El însuşi, împreună cu toate 
caracterele care urmează până la sfârşitul rândului, sunt ignorate; 

” — între o pereche de ghilimele se include un şir de caractere; 

\ — o bară oblică stânga prefixează un caracter pe care dorim să-l utilizăm în 
contextul respectiv ca o literă şi nu cu semnificaţia lui uzuală. De exemplu, şirul de 
caractere ”a”B” este format din trei caractere: a, ” şi B pentru că cel de al doilea 
rând de ghilimele nu trebuie considerate ca închizând şirul ci ca un simplu caracter 
din interiorul lui; 

| — între o pereche de bare verticale poate fi dat un sir de caractere speciale pe care 
dorim să le utilizăm într-un nume de simbol. Inclusiv caracterul bară oblică stânga 
(\) poate apare între o pereche de bare verticale, dar ea îşi păstrează semnificația 
de prefix. În particular, ea poate prefixa o bară verticală între o pereche de bare 
verticale. Astfel, şirurile: 


hesti] 
al&.+\|:; Ib 
al&.t+\| 2)<nl>|b 


unde prin <nl> am notat caracterul rand-nou (new line), pot constitui nume de 
simboluri; 

+ — un diez semnalează că următorul caracter defineşte modul în care trebuie 
interpretată construcția care urmează. Cea mai importantă utilizare a diezului este 
de a semnala o formă funcţională, într-o secvenţă de genul: +” fn, unde fn este un 
nume sau o lambda expresie (definiţie de funcţie fără nume); 

` — un accent invers semnalează că ceea ce urmează este un template care conţine 
virgule (mai multe despre template-uri, în secțiunea 2.6.2 Despre apostroful-stânga). 
Un template funcţionează ca un program care modifică forma unui şir de obiecte 
Lisp; 

, — virgulele sunt utilizate în interiorul template-urilor pentru a semnala cazuri 
speciale de înlocuiri; 

: — două puncte semnalează, în general, că următorul simbol trebuie privit ca un 
simbol constant care se evaluează la el însuşi. În alte cazuri, două puncte despart 
numele unui pachet de numele unei variabile definite în acel pachet (de exemplu, în 
userl:alpha, userl este numele unui pachet, iar alpha este numele unei 
variabile). 

Implementările uzuale de Common Lisp sunt insensibile la forma caracterelor 
(minuscule sau majuscule). Intern însă, formele Lisp sunt reprezentate cu 
majuscule, de aceea formele rezultate în urma evaluărilor sunt redate în astfel de 
caractere. 

Numerele întregi zecimale pot fi precedate opțional de un semn şi urmate 
opțional de un punct zecimal (adăugarea unui zero după punct le transformă însă în 
numele reale). Numere întregi în alte baze au sintaxa #nnRddddd sau #nnrddddd, 
în care nn exprimă baza iar ddddd — numărul. Bazele 2, 8 şi 16 permit şi o alta 
scriere, respectiv #b pentru #2r, #0 pentru #8r, şi #x pentru #16r. 

Fractiile, sau numerele rationale, sunt reprezentate ca 


rapoarte dintre un numărător si un numitor, adică o secvenţă: 
semn (opțional) , întreg  (numărător), caracterul /, întreg 
(numitor). Reprezentarea internă si cea tiparita este 
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întotdeauna a unei fracţii simplificate. Dacă numărătorul e 
notat in altă bază decât cea zecimală, numitorul va fi 
interpretat în aceeaşi bază. O fractie simplificabilă la un 


întreg este convertită automat la întreg. Numitorul trebuie să 
fie diferit de zero. Exemple de fracții: 


1/2 

-2/3 

4/6 (echivalent cu fractia 2/3) 
#0243/13 (echivalent cu 163/11) 


Numerele reale au notația obişnuită ce cuprinde punctul zecimal, semnul 
(optional) si puterea (optional). Formatul simplu sau dublu poate, de asemenea, fi 
specificat: 


3.1415926535897932384d0 ; o aproximare in format dublu pentru a 
6.02E+23 ; numărul lui Avogadro 


Numerele complexe sunt notate ca o secvență: #c(<real>, 
<imaginar>), în care <real> şi <imaginar> sunt numere în acelaşi format. 
Exemple de numere complexe: 


#c(1 2) ; numărul 1 + 2*i 
te (0 1) ; numărul i 
#O(2/3. 13) ; convertit intern la #c(0.6666667 1.3) 


Orice combinaţie de litere şi cifre poate constitui un nume de simbol. În plus, 
oricare dintre următoarele caractere poate interveni într-un nume de simbol: + - 
ko / @ $ &$ * + = < > ~.°Printre altele, aşadar, următoarele 


siruri pot fi nume de simboluri: 


alpha 

a21 

la2 

*alpha* (variabilele globale sau de sistem au, în general, nume care încep şi se încheie cu 
asterisc) 

a+b 

a-bt+c 

a/1 

$13 

1%2 

a^b 

cel_mare 

a=b 

a<b~c& 
dudu@info.uaic.ro 


° Ultimul caracter din acest rând, punctul (.), este caracter de sfarsit de propozitie si, deci, nu 


trebuie considerat printre caracterele enuntate. 
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2.3.2 Liste şi reprezentarea lor prin celule cons 


În Lisp o listă se notează ca un şir de s-expresii separate prin blancuri şi 
închise între paranteze. De exemplu: 


© — lista vidă, notată şi nil sau NIL; 
(a alpha 3) — listă formată din 3 atomi, dintre care primii doi — nenumerici, iar al treilea 
numeric; 


(alpha (a) beta (b 1) gamma (c 1 2)) —listă formată din 6 elemente: primul, al treilea 
şi al cincilea fiind atomi nenumerici, iar al doilea, al patrulea şi al şaselea — fiind la rândul lor liste 
cu unu, două, respectiv trei elemente. 


Traditional, listelor li se pot asocia notații grafice care îşi au obârşia în prima 
implementare a Lisp-ului, realizată pe o maşină IBM 704 la M.I.T. Astfel, o listă se 
notează ca o celulă (numită celulă cons) ce conţine două jumătăţi, prima conţinând 
un pointer către primul element al listei, iar a doua — unul către restul elementelor 
listei. Notaţia grafică a listei ca celulă cons (v. Figura 2.2) mimează definiţia 
recursivă a structurii de listă: o listă este formată dintr-un prim element şi lista 
formată din restul elementelor. Să observăm că această definiţie se poate aplica 
pentru liste nevide, adică liste care au cel putin un prim element. Tot traditional, 
prima jumătate a unei celule cons, se numeşte car, iar cea de a doua car. 


afl to 


pointer către restul pointer către restul restul listei (c) e 
listei (a b c) listei (b c) lista vida 


pointer catre pointer catre pointer către 
primul element al primul element primul element 
listei (a b c) al listei (© c) al listei (c) 
a b c 
întreaga listă (a b c) lista (o c) e lista (c) e 
e reprezentată de reprezentată de reprezentată de 
această celulă cons această celulă cons această celulă cons 


Figura 2.2: Notatia grafică de listă 


Evident, prin constructii de acest fel pot fi reprezentate liste în liste, pe oricâte 
niveluri. Figura 2.3 exemplifică lista: 
(a (alpha beta) (b (beta (gamma delta)) c)) 
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tow dna 
FERTA 


beta 


gamma delta 


Figura 2.3: Un exemplu de listă 


2.3.3 Perechi si liste cu punct 


Celula cons în care atat car-ul cat si cdr-ul indică s-expresii atomice poartă 
numele de pereche cu punct, pentru ca in notatia liniară cele două elemente sunt 
reprezentate între paranteze, separate prin punct. Astfel celula cons din Figura 2.4a 
se notează: (a.b). Dacă o listă conține perechi cu punct o vom numi listă cu 
punct. Reprezentarea din Figura 2.4b trebuie notată (a b.c), pentru că restul listei 
reprezentată de prima celulă cons este lista cu punct (b.c). Să mai observăm că 
orice listă simplă poate fi notată si ca o lista cu punct. Astfel, lista (a b c) poate fi 
notată (a.(b.(c.nil))). Nu este adevărat însă că orice listă cu punct poate fi 
notată ca o listă simplă. 


Figura 2.4: Liste cu perechi cu punct 


2.3.4 Evaluarea expresiilor 


Un program Lisp este format numai din apeluri de funcții. Practic, însăşi o 
definiție de funcţie este, de fapt, tot un apel al unei funcţii care creează o asociere 
între un nume al funcţiei, o listă de parametri formali şi un corp al ei. 

Vom presupune în cele ce urmează că expresiile Lisp sunt interpretate într-o 
buclă READ-EVAL-PRINT în care are loc o fază de citire a expresiei de pe fluxul de 
intrare, urmată de o fază de evaluare a ei şi de una de tipărire a rezultatului. Vom 
presupune că prompter-ul Lisp este >. Orice expresie ce urmează a fi evaluată se 
prezintă pe un rând imediat după prompter, pentru ca pe rândul următor să apară 
rezultatul tipărit al evaluării. 

Expresiile se evaluează după câteva reguli simple: 


- un atom numeric se evaluează la el însuşi: 
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3.14 
.14 


> 
3 
> 
3 

In Lisp pot fi reprezentate numere oricat de mari fara riscul de a provoca vreo 
depasire: 


> 9999999999999999999999999999999999999999999999999999999 
9999999999999999999999999999999999999999999999999999999 


- un atom simbolic care are o valoare predefinita (în sensul asignării sau al 
legării) se evaluează la această valoare. Astfel, presupunând că simbolului a i 
se asociase anterior valoarea alpha: 


> a 
alpha 


Exceptie fac simbolurile: nil care, fiind notatia pentru lista vida cat si pentru 
valoarea logică fals, se evaluează la el însuşi si t care se evaluează la valoare 
logică adevărat (t rue sau TRUE). Orice s-expresie diferită de nil este considerată 
a fi echivalentă logic cu true: 


> nil 
NIL 
e E 
TRUE 


- un atom simbolic care nu are o valoare predefinită daca este evaluat va 
provoca un mesaj de eroare de genul UNBOUND-VARIABLE; 
- o expresie simbolică prefixată cu apostrof (quote) se evaluează la ea însăşi: 


- o listă care are pe prima poziţie un atom recunoscut ca nume de forma Lisp 
predefinită sau de funcţie definită de utilizator se evaluează astfel: forma Lisp 
sau funcția dictează maniera în care se face evaluarea următoarelor 
elemente ale listei: care dintre acestea se evaluează şi care sunt lăsate 
neevaluate. Evaluate ori nu, argumentele apelului sunt trecute apoi corpului 
formei sau al funcţiei, drept parametri actuali. Valoarea rezultată în urma 
evaluării corpului formei sau funcţiei cu aceşti parametri este cea care se 
întoarce: 


e a (a a AR); 
3 
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Primul element al listei este recunoscut drept numele funcţiei de adunare, +. 
Parametrii adunării rezultă prin evaluarea următoarelor două elemente ale listei, 
respectiv atomii numerici 2 şi 1. Cum evaluarea îi lasă neschimbati, ei sunt trecuţi ca 
atare drept parametri actuali ai adunării. Aplicarea funcţiei + asupra lor produce 
rezultatul 3, care este tipărit. În Lisp, operatorii de calcul aritmetic, ca şi orice alt 
nume de funcţie, se notează înaintea argumentelor (notație prefixată). 


> (setq a 'alpha) 
alpha 


Primul element al listei este recunoscut drept forma Lisp setq. Forma setq 
asignează argumentelor din apel de pe poziţiile impare valorile rezultate din 
evaluarea argumentelor din apel de pe poziţiile pare. Astfel simbolului a i se 
asignează rezultatul evaluării lui 'alpha adică alpha. Valoarea ultimului element al 
listei este şi valoarea întoarsă de funcţie. Forma setq constituie un exemplu de 
funcţie cu efect lateral, efect ce se manifestă prin lăsarea în context a unor valori 
asignate unor simboluri nenumerice. Forma setq este prima dintr-o serie de forme 
cu care ne vom întâlni mai departe şi care sunt utilizate cu precădere pentru efectele 
lor laterale mai degrabă decât pentru valorile întoarse de ele. 


- evaluarea unei liste care are pe prima poziţie o lambda-expresie va fi 
prezentată în secțiunea 2.4.15 Lambda expresii; 

- o listă care are pe prima poziţie un nume de macrodefinitie va fi prezentată în 
secţiunea 2.6 Macro-uri; 

- orice altceva (ca de exemplu, o listă care are pe prima poziţie o listă diferită 
de o lambda-expresie, sau un atom ce nu este cunoscut ca nume de formă 
Lisp sau macro, aşadar nu face parte din biblioteca de funcţii ale Lisp-ului şi 
nici nu este o funcţie definită de utilizator) provoacă, în momentul lansării în 
evaluare, un mesaj de eroare de genul UNDEF INED-FUNCTION. 


2.4 Funcţii şi forme Lisp 


2.4.1 Notatii 


Am vorbit până acum despre funcții şi forme Lisp fără să precizăm distincția 
dintre ele. Funcţiile Lisp-ului îşi evaluează toate argumentele înainte de a le 
transfera corpului funcţiei. În afara funcţiilor, prin utilizarea macro-urilor (v. secțiunea 
2.6 Macro-uri), s-au creat forme speciale care aplică reguli specifice de evaluare a 
argumentelor. Limbajul Lisp numără o clasă semnificativă de funcţii şi de forme 
predefinite. 

In prezentarea funcțiilor şi a formelor vom adopta o convenţie de notație, care 
să ne permită să identificăm argumentele ce se evaluează fata de cele care nu se 
evaluează, tipul acestora, rezultatul evaluării, precum şi manifestarea, atunci când 
va fi cazul, a efectelor laterale. Aceste convenții de notare sunt următoarele: 


e — s-expresie 

n — atom numeric 

i — număr întreg 

c — număr complex 
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s — atom nenumeric (simbolic) 
1 — listă 


f — funcţională (nume sau definiţie de funcţie sau formă). 


Dacă un astfel de simbol, aflat pe poziţia unui argument al unui apel de formă 
Lisp, este prefixat cu un apostrof (” e, spre exemplu), vom înțelege că argumentul 
aflat pe acea poziţie se evaluează la un obiect Lisp de tipul indicat de simbol (s- 
expresie, în cazul exemplului de mai sus). Dimpotrivă, dacă el este notat fără 
apostrof, atunci argumentul respectiv, ce trebuie să respecte tipul indicat de simbol, 
nu se evaluează (să observăm ca această convenție este una mnemonică pentru 
că, într-adevăr, prin evaluarea unui obiect Lisp prefixat cu un apostrof, rămânem cu 
argumentul fără prefix). În plus, pentru simplificare, vom nota întotdeauna 
argumentele ce rezultă în urma evaluării obiectelor prefixate cu apostrof, prin 
aceleaşi litere. Astfel, dacă ’ nj,... *n, sunt argumentele evaluabile şi de tip numeric 
ale unui apel, vom considera, fără a mai menţiona acest lucru, că numerele ce 
rezultă în urma evaluării acestora sunt notate cu nj,... ny. De asemenea, vom 
considera de la sine înţeles că orice apel realizat cu argumente de tipuri diferite 
celor indicate în definiţii duce la generarea unor mesaje de eroare. 

Ca şi mai sus, vom utiliza simbolul >>> cu semnificaţia „se evaluează la”. 
Astfel, în definițiile de funcţii care urmează, printr-o notație e. >>> ez vom înţelege 
că forma Lisp e. (o s-expresie, în acest caz) se evaluează la forma e (de 
asemenea o s-expresie). Vom renunţa însă la descrierea formală a valorii întoarse 
în favoarea unei descrieri libere, atunci când, datorită complexității operaţiilor 
efectuate de formă sau funcție, o descriere formală ar începe să semene mult prea 
mult cu însăşi o implementare a ei. 

Renuntarea la restricţiile unui Lisp pur a dus inclusiv la acceptarea unui 
mecanism de evaluare care să întoarcă mai mult decât o singură valoare. Astfel, 
construcția values din Common Lisp pune într-o structură specială valori multiple 
(vom vedea în secțiunea 2.5.8 Valori multiple şi exploatarea lor) cum pot exploatate 
acestea). In notația noastră vom separa prin virgule valorile multiple rezultate dintr-o 
evaluare: e >>> e»,...,en. În plus, vom nota prin ~nil o valoare despre care ne 
interesează să ştim că e diferită de nil. 

În cazul în care evaluarea produce şi efecte laterale, le vom nota după o bară 
verticală: e, >>> e2 | <efecte>. Un anumit tip de efect lateral, atribuirea unei 
valori unui simbol, va fi notat printr-o săgeată orientată stânga: s€e, cu 
semnificaţia: simbolul s se leagă la valoarea e, sau simbolului s i se asignează 
valoarea e. De asemenea, în notarea efectelor laterale, vom atribui virgulei (, ) 
semnificaţia unui operator de execuţie serială şi dublei linii verticale (ll), cea de 
operator de execuţie paralelă. Cu alte cuvinte, o secvenţă de efecte laterale 
Ei,..,Ex va semnifica consumarea secventiala, în ordinea stânga-dreapta, a 
acestora, pe când printr-o notație Ell... E, vom înţelege consumarea aceloraşi 
efecte în paralel. 

Atunci când este important momentul evaluării formei care produce valoarea 
întoarsă de apelul de funcţie relativ la momentele producerii efectelor laterale, vom 
nota evaluarea formei care produce valoarea întoarsă printre efectele laterale într-o 
pereche de paranteze pătrate, de exemplu: [e]. 
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Daca anumite efecte laterale, produse pe parcursul evaluarii unei forme, nu 
sunt persistente, in sensul ca nu raman ca observabile in contextul de evaluare a 
formei si dupa terminarea evaluării formei, atunci îndepărtarea lor este notată 
explicit. Astfel, îndepărtarea efectului asignării unei valori simbolului s va fi notată 
unbind (s). Pentru a descrie acţiuni repetitive vom folosi structura de iterare while 
<test> (<corp>) intercalată în lista efectelor laterale. 

În prezentările apelurilor de funcţii pot să apară şi cuvinte cheie, care se 
recunosc pentru că sunt întotdeauna prefixate cu caracterul două-puncte (:). Într-un 
apel real ele trebuie reproduse ca atare. Astfel de cuvinte cheie, pot fi: 

:test cu semnificaţia că ceea ce urmează este un test care va acţiona prin 

valoarea T; de obicei el prefixează un nume de funcţională, care este dat în 

sintaxa +” f; 

:test-not — prefixeaza un test care acţionează prin valoarea NIL. 


2.4.2 Asignarea unei valori unui simbol 


Într-un limbaj imperativ, o notație de genul x:=y, unde x şi y sunt variabile, 
este în general recunoscută ca având interpretarea: se atribuie variabilei x valoarea 
pe care o are variabila y. Să observăm însă că, în sine, o astfel de notație lasă loc la 
cel puţin încă două interpretări: variabila x „se leagă” la variabila y, înțelegând prin 
aceasta că încât ori de câte ori y se va modifica, x se va modifica în acelaşi mod şi 
variabilei x i se atribuie ca valoare însuşi simbolul y. După cum vom vedea, Lisp-ul 
face posibile toate aceste interpretări. Cea mai apropiată de accepțiunea din 
limbajele imperative, „atribuirea” (sau „asignarea”) unei valori este prezentată în 
continuare. 

Despre forma setq s-a vorbit deja informal în secţiunea 2.3.4 (Evaluarea 
expresiilor Lisp). Evaluarea argumentelor de pe poziţiile pare şi, respectiv, asignările 
se fac în ordine, de la stânga la dreapta: 

(setq Sı ler. Sk eg) >>> exlsiCe,..,skC Lex] 


> (setq x ’(a b c) y (cdr x)) 
(B C) 


Forma set este ca si setq numai că ea isi evaluează toate argumentele: 
dacă ’e, >>> Siy.. "Ezra >>> Sax atunci: 
(set 1er lez. 7ask-1 ezk) >>> epsk|S1&e2,.. S2*k-1€ ez] 


(set (car t(x y)) ’(a bc) (car x) (cdr x)) 
B C) 

a 
B C) 


> 

( 

> 

( 
Forma psetq este analogă lui setq cu deosebirea ca asignările se fac în 

paralel: mai întâi toate formele de rang par sunt evaluate serial şi apoi tuturor 

variabilelor (simbolurile de pe pozițiile impare) le sunt asignate valorile 

corespunzătoare: dacă 'e. >>> S1, "ask >>> So*x-1 atunci: 

(ps tq "e, lez.. 7 Eoxk-1 1 Eo2xk) >>> ezk] E27. [ezk], Si€eol... ll 

Brr CF ox, 
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În exemplul următor valorile lui x şi y sunt schimbate între ele: 


` 


(setq x `a) 


> 
A 
> (setq y `b) 
B 
> 


(psetq x y y x) 
NIL 
> xX 


B 
oN: 
A 


2.4.3 Functii pentru controlul evaluarii 


Am vazut deja ca prefixarea unei s-expresii cu un apostrof este echivalenta 
apelului unei funcţii quote. Aşadar quote împiedică evaluarea: 
(quote e) >>> e 

Funcţia eval forțează încă un nivel de evaluare. Astfel, dacă: 'e >>> e» 
şi 'e> >>> e3, atunci: (eval 'e.) >>> ez 


> (setq x 'a a 'alpha) 
ALPHA 

> (eval x) 

ALPHA 
> 
3 


(eval ’(+ 1 2)) 


2.4.4 Operații asupra listelor 


Construcţia listelor 


Funcţia cons construieşte o celulă din două s-expresii, rezultate din 
evaluarea celor două argumente, punându-l pe primul în jumătatea car şi pe cel de 
al doilea în jumătatea car: 

(cons ’e, 'e>) >>> (e..e2) 


(cons ’a nil) 
A) 
(cons 'a 'b) 
A.B) 
(cons 'a ’ (a b)) 
A A B) 
(cons ‘alpha (cons ’beta nil)) 


> 
( 
> 
( 
> 
( 
> 
(ALPHA BETA) 


Funcţia list creează o listă din argumentele sale evaluate: 
(list ei .. 'ex) >>> (e1. (...(e,.nil)...) ) 


(list ’a 'b ‘c) 


> 
(A B C) 
> (list ’a ’(b c)) 
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Funcţia append creează o listă prin copierea şi punerea cap la cap a listelor 
obținute din evaluarea argumentelor sale. Astfel, daca: 


‘li >>> (iq tea eni 1 aaa as >>> (en. (..(enx .nil)..)) 

atunci: 

(append ” li . 111) >>> (535 bbei te etn tatea a eta) 
> (append ’(a b c) ’ (alpha beta) ’ (1 gamma 2) ) 


(A B C ALPHA BETA 1 GAMMA 2) 


De notat ca ultimul argument poate fi orice s-expresie, iar nu o lista cu necesitate. 


> (setq 11 (list 'a 'b) 12 (list 'c 'd 'e) 13 Tf) 
FP 

> (append 11 12 13) 

(ABCODE. F) 


Funcţia creează celule cons noi corespunzătoare tuturor elementelor listelor 
componente, cu excepţia celor aparținând ultimei liste, pe care le utilizează ca atare. 


Accesul la elementele unei liste 


Funcţiile car şi cdr extrag s-expresiile aflate în poziţiile car, respectiv car, 
ale unei celule cons. Dacă lista e vidă car întoarce încă nil. Dacă '1 >>> 
(e .e2), atunci: 
(car 71) >>> ea 
(cdr 11) >>> ez 
( 
( 


car nil) >>> nil 
cdr nil) >>> nil 


ALPHA BETA) 
(cdr ’ (a b c)) 


> 
A 
> (car ’((alpha beta) b c)) 
( 
> 
( 
> 


Prin combinatii car-cdr poate fi accesat orice element de pe orice nivel al 
unei liste. Pentru simplificarea scrierii, implementarile de Lisp pun la dispoziţie notații 
condensate, ca de exemplu caddarinlocde (car (cdr (cdr (car ...)))). 

Functia nth selecteaza un element de pe o pozitie precizata a unei liste. 
Primul argument trebuie sa fie un intreg nenegativ si desemneaza numarul de 
ordine, iar al doilea — o lista, din ea urmând a se face selecţia. Dacă '1 >>> 
(eo. (..(@m-nil)..) ) şi O<n<m, atunci: 

(nth ’n 71) >>> en 
Dacă n>m, atunci: 
(nth ’n 71) >>> nil 
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> (nth 1 ’ (ab c)) 
B 

> (nth 3 ’ (ab c)) 
NIL 


Similar, functia nthedr efectueaza de un numar intreg si pozitiv de ori cdr 
asupra unei liste. Daca 1= (eo. (... (€m. nil)..)) şi O<n<m, atunci: 
(nth ’n 71) >>> (en. (.. (€m. nil)..)) 
Dacă n>m, atunci: 
(nth ’n 71) >>> nil 


> (nthcdr 0 ’ (a b c)) 
(A B C) 

> (nthcdr 1 ’ (ab c)) 
(B C) 

> (nthcdr 4 ’ (ab c)) 
NIL 


Funcția last întoarce ultima celulă cons a unei liste. Daca 
1= (e. (...(ex.nil)...)), atunci: 
(last 11) >>> (e,.nil) 
(last nil) >>> nil 


> (last ’(ab_c)) 

(c) 

> (last (cons 'a ‘b)) 
(A B) 

> (last (cons ’a nil)) 
(A) 


2.4.5 Operatii cu numere 


Lisp-ul are o biblioteca foarte bogată de funcţii aritmetice. Dintre ele, 
prezentăm doar câteva în rândurile următoare. 


Operatiile de adunare, scădere, înmulţire şi împărțire (k > 1): 


(+ 'ny a nk) >>> ny tu. + Nk 
(- ‘’n) >>> -ngsidacak>1, atunci: (- ni ...’n,) >>> ny - .. - Nk 
CR na te Me) Tg ES SE A 
(/ "ny ..’ Ny) >>> ny fe hos a Nk 

> (+ 1 2 3) 

6 

(eb eB 3 YZ) 

=3 

So (e 1 2. 3) 

6 

> (/ 6 3 2) 

1 
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Functia / intoarce o fractie (numar rational) daca argumentele ei sunt numere 
întregi şi împărţirea nu e exactă. 


> (/ 2 3) 
2/3 


Această funcţie, ca şi tipul de data număr rational, oferă, aşadar, o cale foarte 
elegantă de a opera cu fracţii zecimale: 


Sr GE le Gf 22-3)) 


5/3 

POO CF 2s BY PB 2)) 
1 

> (+ (/ 1 3) (/ 2 5)) 
11/15 


Asa cum am aratat si mai sus, reprezentarea numerelor ca liste face sa nu 
existe limite ce pot fi atinse usor in operatiile cu acestea, de aceea apeluri ca cele 
de mai jos sunt posibile: 


> (* 99999999999999999999999999999999999999999999999999999999 
8888888888888888888888888888888888888888888888888888) 
8888888888888888888888888888888888888888888888388888799991111111111111 
111111111111111111111111111111111111112 


Pentru toate funcţiile aritmetice acţionează următoarea regulă de 
contaminare: în cazul în care argumentele unei funcţii numerice nu sunt de acelaşi 
tip, toate sunt aduse la tipul celui mai „puternic”, conform următoarei ierarhii: 
complex > real > raţional > întreg. 


Reguli de canonizare 


Un rational cu numitor 1 e considerat întreg, un real cu 0 după virgulă e considerat 
întreg, un complex cu partea imaginară 0 e considerat real. 


> (+ (/ 1 3) (/ 2.0 5)) 
0.73333335 


Toate operaţiile de mai sus se aplică şi asupra argumentelor numere 
complexe: 


> (+ #c(1 2) #c(3 2)) 
#c(4 4) 

> (- #c(1 2) #c(3 2)) 
2 

> (* #c(1 2) #c(3 2)) 
#c(-1 8) 

> (/ #c(1 2) #c(3 2)) 
+c (7/13 4/13) 
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Există mai multe funcții de rotunjire a unei valori. Funcţiile floor şi ceiling 


rotunjesc o valoare în jos, respectiv în sus. Dacă n este întreg, real sau zecimal şi 
m<n<m+1, cu mun întreg, atunci: 


( 


floor ‘’n) >>> m, n-m 


(ceiling ’n) >>> m + 1, n = (m+ 1) 


Fiy 


loor 2) 


loor 2.9) 


Hh 


.9000001 
(floor 2/3) 


/3 
( 


ceiling 2) 


(ceiling 2.9) 


WV ONVNOVAOANV ON V 


-0.099999905 

> (ceiling 2/3) 
1 

-1/3 


Daca apelurile se efectueaza cu doua argumente intregi se obtine calculul 


catului şi al restului (comportamentul unei funcţii care calculează modulo). Astfel, 
dacă c este cel mai mic întreg pozitiv si r este un întreg pozitiv astfel încât nı = c 
* n + r, atunci: 


(i 


Floor. "nr ' nis) >>> Ch E 


(ceiling ’ni n2) >>> c + 1, -r 


>(floor 7 3) 

2 

1 

>(ceiling 7 3) 
3 

-2 


Există două forme Lisp de incrementare, respectiv, decrementare, fără efecte 


laterale: functiile 1+, respectiv 1-: 


( 


(1 


+ 


'n) >>> n + 


'n) >>> n - 1 


(setq x 1) 
(I+ x) 

x 

(1- x) 


> 
1 
> 
2 
> 
1 
> 
0 
> x 
1 
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După cum se observă, funcţiile nu afectează argumentele. Macro-urile incf şi 


decf fac acelaşi lucru, dar afectează argumentele: 


(incf 
(decf 


'n) >>> n + 1 |n E nr 
'n) >>> n-1]n€n- 1 

> (setq x 1) 

1 

>: (inc# x) 

2 

> x 

2 

> (decf x) 

T 

> x 

I 


Dacă în apel apare si un al doilea argument, el e considerat incrementul, 


respectiv decrementul: 


(incf 
(decf 


număr 


"ni ’no) >>> m + ns | n © nr + no 
"ni Tna >>> ni = no | nr © ni = no 

> (setq x 1) 

d 

> (incf x 2) 

3 

2 .< 

3 

> (decf x 4) 

= 

ee 


= 


De notat ca argumentele funcţiilor 1+, 1-, incf şi decf pot fi orice fel de 


, inclusiv complex. În acest din urmă caz incrementarea, respectiv, 


decrementarea se aplică numai părții reale. 


(abs 


(abs 


număr 


Calculul valorii absolute: dacă n>0, atunci: 
'n) >>> n 


Daca n<0, atunci: 
'n) >>> -n 


> (abs (- 3 5)) 
2 


Dacă argumentul este număr complex, rezultatul este modulul, considerat ca 
real. 


> (abs #c(3 -4)) 
5.0 


Funcţiile max şi min calculează maximumul şi minimumul unor şiruri de 


numere. Dacă n=max (n1,... nx), atunci: 
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(max "Ni ..’Nk) >>> n 
Dacă n=min(nj,.. nx), atunci: 
(min ’n, ..’nx) >>> n 


Aritmetica numerelor complexe 


In afara operatiilor uzuale cu numere, ce se rasfrang si asupra numerelor 
complexe (*, -, *, /, 1+, 1-, incf, decf, abs), următoarele funcţii acceptă ca 
argumente numai numere complexe: conjugate, realpart, imagpart. 

Daca ’c >>> #c(n; n2), atunci: 

(conjugate '’c) >>> #c(n, =n2) 
(realpart 'c) >>> n 
(imagpart 'c) >>> n2 


Funcția complex compune un număr complex dintr-o parte reală şi una 
imaginară: 
(complex 'n; ’n2) >>> #c(nı No) 


(conjugate (complex 1 2)) 
c(1 -2) 
(realpart (complex 2 3)) 


> 
# 
> 
2 
> (imagpart (complex 2 3)) 
3 


2.4.6 Predicate 


Predicatele sunt functii care intorc valori de adevar. Multe dintre ele verifica 
tipuri şi relații. 
Dacă e este un atom, atunci: 
(atom ’e) >>> t 
altfel: 
(atom 'e) >>> nil 


Dacă e este un atom simbolic, atunci: 
(symbolp ’e) >>> t 
altfel: 
(symbolp ’e) >>> nil 


Daca e este numar, atunci: 
(numberp ’e) >>> t 
altfel: 
(numberp ’e) >>> nil 


Dacă e este număr întreg, atunci: 
(integerp 'e) >>> t 

altfel: 
(integerp ’e) >>> nil 


Daca e este numar real, atunci: 
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(floatp ’e) >>> t 


(floatp ’e) >>> nil 


Dacă n este număr întreg par, atunci: 
(evenp ’n) >>> t 
altfel: 
(evenp ’n) >>> nil 


Dacă n este număr întreg impar, atunci: 
(oddp n) >>> t 
altfel: 
(oddp ’n) >>> nil 


Dacă n este număr şi n>0, atunci: 
(plusp ’n) >>> t 
altfel: 
(plusp ’n) >>> nil 


Dacă n este număr si n<0, atunci: 
(minusp 'n) >>> t 
altfel: 
(minusp 'n) >>> nil 


Dacă n=0, atunci: 
(zerop ’n) >>> t 
altfel: 

(zerop ’n) >>> nil 


Dacă n.= .. =nx, atunci: 
(= Cni e nk) >>> t 
altfel: 
(= 'n, .. Onk) >>> nil 
Dacă ni< ... <n, atunci: 
(< nia Dx) >>> t 
altfel: 
(< ’n, .. nk) >>> nil 
Dacă n.> ... >nx, atunci: 
(> ni m nk) >>> t 
altfel: 
(> ni .. nk) >>> nil 
Daca nis ... <n,, atunci: 
(<= ‘ny .. nk) >>> t 
altfel: 


(<= ni .. Nk) >>> nil 
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Dacă n-> ... >nx, atunci: 


(>= "Na .. Nk) >>> t 
altfel: 
(>= "Na. “ny) >>> nil 


Dacă 'e >>> s şi s este un simbol legat, atunci: 
(boundp ’e) >>> t 
altfel: 
(boundp ’e) >>> nil 
Z) 


(setq x 'y y 


(boundp ’x) 


7 
d 


(boundp x) 


7 
p| 


(boundp 'y) 


> (boundp y) 
NIL 


Dacă e. şi e sunt izomorfe structural (deşi pot fi obiecte Lisp distincte) 
atunci: 


(equal ’e, 'e2) >>> t 
altfel: 
(equal ’e,; 'e2) >>> nil 


> (equal 'alpha 'alpha) 


(equal ’(a b c) (cons ’a (cons ’b (cons ’c nil)))) 
> (equal ’(a b c) (cons ’a (cons 'b 'c))) 
NIL 
> (setq x ’(a b c) y (cdr x)) 
(B C) 


> (equal y ’ (b c)) 


> (equal (cdr x) y) 


Dacă e, şi e. reprezintă aceeaşi structură (obiect) Lisp, cu alte cuvinte, daca 
ele adresează elemente aflate la aceeaşi adresă în memorie, atunci: 
(eq ’e, 'e2) >>> t 
altfel: 
(eq ’e, 'e2) >>> nil 


> (eq 'alpha 'alpha) 
F 


În Common Lisp simbolurile sunt reprezentate cu unicitate. Acest lucru face 
ca apelul de mai sus se evalueze la T. Standardul nu obligă însă reprezentarea cu 
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unicitate a numerelor si nici a sirurilor de caractere. Din acest motiv nu poate fi 
garantat un rezultat pozitiv in cazul testarii cu eq a doua numere egale sau a doua 
şiruri de caractere identice şi, ca urmare, astfel de operații trebuie evitate: 


> (eq 1 1) 

222 

> (eq "alpha" "alpha") 
222 


> (eq "a bc) (cons “a. (cons ’b (cons e nil)))) 
NIL 

> (setq x ’(a b c) y (cdr x)) 

(B C) 

> (eq (cdr x) ” (b c)) 

NIL 

> (eq (cdr x) y) 

T 


Predicatul eq1 funcționează la fel ca şi eq, cu excepţia faptului că el întoarce 
T inclusiv pentru numere egale, deci obiecte care sunt si „conceptual”, iar nu numai 
strict implementational, identice. In privinta listelor si a sirurilor de caractere eq si 
eql se comportă la fel. 


> (eql 1 1) 
T 


Daca e=nil atunci: 


(null ’e) >>> t 
altfel: 
(null ’e) >>> nil 


2.4.7 Liste privite ca multimi 


Funcția member verifică existența unei s-expresii într-o lista. Daca 
TL >>> (e1. (e (ex. (...(en.ni1)...))..)), unde e, este prima apariţie a acestei s- 
expresii în lista 1 care satisface (f e e.) >>> t,cu f o funcţională ce necesita 


exact doi parametri, atunci: 
(member ’e 71 :test #’f£) >>> (e. (..(e,.nil)..) ) 


Implicit, Common Lisp considera functionala de test ca fiind eql. Când se 
doreşte utilizarea acesteia în test, ea poate fi ignorată: 
(member 'e, 71) >>> (ex. (..(e,.nil)...)) 


> (member 'alpha ’(a alpha b alpha)) 

(ALPHA B ALPHA) 

> (member 3 '(1 2 3 4 5) :test #'<) 

(4 5) 

> (member 3 '(1 2 3 4 5) :test #'evenp) 

Error: EVENP got 2 args, wanted 1 arg. 

> (member '(3 4) '(1 2 (3 4) 5)) 

NIL 

> (member '(3 4) '(1 2 (3 4) 5) :test #'equal) 
((3 4) 5) 
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> (setq x '(1 2 (3 4) 5)) 
(1 2 (3 4) 5) 

> (member (caddr x) x) 
((3 4) 5) 

Funcţiile union si intersection realizează reuniunea, respectiv 
intersecția, a două liste, ca operaţii cu mulțimi, în sensul excluderii elementelor 
identice. Testarea identității, ca şi în cazul funcţiei member, este lăsată la latitudinea 
programatorului. Testarea trebuie realizată cu o funcție binară anunțată de cuvântul 
cheie :test. Dacă lipseşte, testul de identitate se face implicit cu eql. Ordinea 
elementelor în lista finală este neprecizată. Numai forma apelului este dată mai jos: 
(union ‘1, 112 :test #'f) 
(intersect 71, 71» :test #’f) 


> (union '(a b c d) '(1 a2 b 3)) 

(D C 1A 2B 3) 

> (intersection '(a b cd) '(1 a 2b 3)) 
(B A) 


Testul excluderii poate lasa incerta provenienta elementelor ce se copiaza in 
lista finala. 


> (union '((a 1) (b 2) (c 3) (d 4)) "'((a alpha) (c gamma) (e 
epsilon)) :test #'(lambda(x y) (eql (car x) (car y)))) 

((D 4) (B 2) (A ALPHA) (C GAMMA) (E EPSILON) ) 

> (intersection '((a 1) (b 2) (c 3) (d 4)) '((a alpha) (c gamma) (e 
epsilon)) :test #'(lambda(x y) (eql (car x) (car y)))) 

((C 3) (A 1)) 


În aceste exemple testul excluderii verifică identitatea elementelor de pe 
poziția car a listelor-perechi-de-elemente ce intră în componenţa argumentelor 
originale. Perechile de elemente (a 1) şi (a alpha), respectiv (c 3) şi (c gamma) 
răspund pozitiv la test. Proveniența elementelor selectate în lista-multime finală, în 
cazul lor, e nedecidabilă. Functionala lambda, utilizată în aceste exemple, este 
tratată în secțiunea 2.4.15 Lambda expresii. 


2.4.8 Operații logice şi evaluări controlate 


Operatorii logici în Lisp sunt and, or şi not. Dintre aceştia and şi or, pentru 
că îşi evaluează argumentele în mod condiţionat, sunt consideraţi şi structuri de 
control. Funcţia not are acelaşi comportament ca şi null. Dacă e >>> nil, 
atunci: 

(not ’e) >>> t 
altfel: 
(not ’e) >>> nil 


Macro-ul and primeşte un număr oarecare n>1 de argumente pe care le 
evaluează de la stânga la dreapta până când unul din ele întoarce ni1, caz în care 
evaluarea se opreşte şi valoarea întoarsă este nil. Dacă, nici unul dintre primele 
n-1 de argumente nu se evaluează la nil, atunci and întoarce valoarea ultimului 
argument. Dacă ’e, >>> nil, atunci: 
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(and ei e2... en) >>> nil 
altfel, dacă ’e2 >>> nil, atunci: 
(and ’e, ez... En) >>> nil 
s.a.m.d., altfel: 

(and e lez m en) >>> en 


> (setq n 7) 

7 

> (and (not (zerop n)) (/ 1 n)) 
1/7 

> (setq n 0) 

0 

> (and (not (zerop n)) (/ 1 n)) 
NIL 


Macro-ul or primeşte un număr oarecare n>1 de argumente pe care le 
evaluează de la stânga la dreapta până când unul din ele întoarce o valoare diferită 
de nil, caz în care evaluarea se opreşte şi valoarea acelui argument este şi cea 
întoarsă de or. Dacă, toate primele n-1 de argumente se evaluează la nil, atunci 
or întoarce valoarea ultimului argument. Dacă 'e. >>> ~nil, atunci: 

(or 7e1 e2.. Cn) >>> eu 
altfel, dacă 'e> >>> ~nil, atunci: 
(or ’e, lez.. en) >>> e2 


s.a.m.d., altfel: 
(or ei lez.. 161) >>> en 
> (setq n 7) 
7 
> (or (not (zerop n)) (/ 1 n)) 
T 
> (setq n 0) 
0 
> (or (not (zerop n)) (/ 1 n)) 
Error: Attempt to divide 1 by zero. 


2.4.9 Forme pentru controlul evaluarii 


Cele mai utilizate forme Lisp pentru controlul explicit al evaluării sunt if şi 
cond. Forma if poate fi chemată cu doi sau trei parametri. În varianta cu trei 
parametri, evaluarea ei se face astfel: dacă ' e, >>> ~nil, atunci: 

(if ’e, 'e2 e3) >>> e 

altfel: 
(if 'eı e2 e3) >>> ez 

În varianta cu doi parametri, dacă: e; >>> ~nil, atunci: 
(if ’e, 'e2) >>> ex 

altfel: 
(if ’e1 e2) >>> nil 


> (if (zerop (seta x 0)) "eroare" (/ 1 x)) 
"eroare" 
> (if (zerop (setq x 2)) "eroare" (/ 1 x)) 
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cond este cea mai utilizată formă de control a evaluării. Sintactic, ea este 
formată dintr-un număr de clauze. Elementele de pe prima poziția a clauzelor se 
evaluează în secvență până la primul care e diferit de nil. In acest moment 
celelalte elemente ale clauzei de evaluează şi cond întoarce valoarea ultimului 
element din clauză. Dacă toate elementele de pe prima poziție din clauze se 
evaluează la nil, atunci cond însuşi întoarce nil. Dacă ’e1; >>> ~nil, atunci: 


(cond ("ei .. Pages ad) es APS za ekn*) ) >>> Sin 

ş.a.m.d., altfel dacă e, >>> ~nil, atunci: 

(cond (lei .. Bae) we (PCR ue Fe) >>> en” 

altfel: 

(cond (ei de Sia) m (Ceki = en hr, >>> nil 
> (cond ((setq x t) "unu") ((setq x t) "doi") (t "trei")) 
"unu" 
> (cond ((setq x nil) "unu") ((setq x t) "doi") (t "trei")) 
"doi" 
> (cond ((setq x nil) "unu") ((setq x nil) "doi") (E "trei")) 
"trei" 


Cu toata simplitatea ei, forma if are un dezavantaj, si anume faptul ca nu 
permite evaluarea a mai mult decât o singură expresie înainte de ieşire. Soluţia o 
dau formele when şi unless. Astfel, dacă ’e, >>> ~nil, atunci: 


(when "e lez m '€n) >>> enlez,..., [en] 
altfel: 

(when 'e- Di Teas wy Seo TA 

Similar, dacă ’e, >>> nil, atunci: 

(unless "e ez .. len) >>> eGnleo,.., [en] 
altfel: 

(unless ’e; ep .. en) >>> nil 


2.4.10 Liste si tabele de asociatie 


Listele de asociatie sunt structuri frecvent folosite in Lisp pentru accesul rapid 
la o data prin intermediul unei chei. Elementele unei liste de asociatie sunt celule 
cons in care părţile aflate în car se numesc chei şi cele aflate în car — date. Pentru 
că introducerea şi extragerea noilor elemente, de regulă, se face printr-un capăt al 
listei, ele pot fi făcute să aibă un comportament analog stivelor. Intr-o astfel de 
structură, introducerea unei noi perechi cheie-dată cu o cheie identică uneia deja 
existentă are semnificația „umbririi” asociaţiei vechi, după cum eliminarea ei poate 
să însemne revenirea „în istorie” la asociaţia anterioară. Pe acest comportament se 
bazează, de exemplu, „egarea” variabilelor la valori. 

Funcţia acons construieşte o noua lista de asociaţie copiind o listă veche şi 
adăugând o nouă pereche de asociaţie pe prima poziţie a acesteia. Ea nu modifica 
lista de asociaţie. 

Dacă '1 >>> ((e11-€21) . (.. ((@in-@2n) -nil)..)), atunci: 

(acons “e "e2 11) >>> ((e1.€2). ((€11.€21). (e ((€1n-€zn) .nil)..))) 
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(setq la (acons 'a 1 nil)) 
A 1)) 

(acons 'b 2 la 
(B . 2) (A. 1) 
(acons 'a 3 la 
A. 3) (A. 1) 


) 
) 
) 
) 

Funcţia pairlis organizează o lista de asociaţie din chei aflate într-o lista si 
date aflate în alta. Nu există o ordine a-priorică de introducere a elementelor în lista 
de asociaţie. Evident, cele două liste-argument trebuie să aibă aceeaşi lungime. 
Dacă 11. >>> (e11. (e. (e1n.nil)..) şi 712 >>> (e21. (e. (@2n-nil)..), atunci: 
(pairlis "la 112) >>> ((e11.€21). (...((e1n.e2n).n11)..)) 


a (palrlis. (List. Tab: ne) (list. 1.2.3) 
(E. ai 3 (Bice 2) (Away L)) 


Dacă apare şi un al treilea argument, care trebuie să fie o listă de asociaţie, 
introducerea noilor elemente se face în faţa celor deja existente în această listă. 
Funcţiile asooc şi rassoc sunt funcţii de acces într-o listă de asociaţie — 
assoc folosind cheia pentru identificarea elementului căutat, iar rassoc — data. 
Dacă: ’1 >>> ((e11.e21). (...( (Gin. @2x) . (.. ( (Cin. Gon) -nil)...))..)) 7 si 
(ex .€e2x) este prima pereche cheie-dată din lista de asociaţie în care apare ei, pe 
poziţia cheii, atunci: 
(assoc "e 11) >>> (e1kx.€2x) 
Pentru aceeaşi listă de asociaţie, dacă (e...e2) este prima pereche cheie- 
dată din lista de asociaţie în care apare ex pe poziţia datei, atunci: 
(rassoc "ex 71) >>> (eik. €z) 


> (setq vals (pairlis (list 'a 'b 'a) (list 1 2 3))) 
(CAL 3). (BE 2) Ars EN) 

> (assoc 'a vals) 

(A . 3) 

> (rassoc 1 vals) 

(A; . 1) 


În mod implicit, testul de identificare a cheii sau a datei, se face cu functia 
eql. Dacă însă se doreşte un alt tip de identificare, atunci o funcţională (care trebuie 
să aibă exact doi parametri) poate fi anunţată, prin cuvântul cheie :test. 

Astfel, dacă Mi) >>> 
((e11.€21) . (... ( (ex .e2x) . (... ( (Ein. @2n) .ni1)...) )...)) şi e: este prima apariţie 
pe poziţia cheii care satisface (f ’e e.) >>> t,cu fo funcţională care necesita 
exact doi parametri, atunci: 

(assoc fe 71 :test #’£) >>> (e1,.e2x) 

În aceleaşi condiţii pentru argumentul * 1, dar cu functionala satisfacand (f 
1e ex) >>> t:i 
(rassoc ’e 71 :test +'f) >>> (e1xk.e2x) 


> (rassoc 2 vals :test #'>) 
(A . 1) 
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Exemplul probează şi ordinea în care se transmit argumentele functionalei: ca 
prim argument al functionalei este considerat primul argument al funcției assoc sau 
rassoc, iar ca cel de al doilea argument — pe rând câte o cheie, respectiv, o dată din 
lista de asociaţie. 


2.4.11 Locaţii şi accese la locaţii 


Forma setf accesează o locaţie, pentru completarea ei prin intermediul unei 
funcţionale care, în mod uzual, solicită o valoare depozitată în acea locaţie. setf, 
aşadar, inversează comportamentul functionalei pe care o primeşte ca prim 
argument, care, în loc de a extrage o valoare deja depozitată într-o locaţie, va 
deschide calea pentru a se memora acolo o valoare. Dacă 'f., >>> ea, . , "fa 
>>> e, atunci: 

(setf /f. ei m "fan lena) >>> enl’ £1 >>> e1, m , fn >>> en 


1 BETA C) 


Oricare dintre următoarele funcţionale poate fi utilizată ca prim argument: 
toate funcţiile c....r, nth. Alte funcţionale vor fi adăugate la această listă pe 
măsură ce vor fi introduse. 


2.4.12 Lista de proprietăţi a unui simbol 


Unui simbol i se poate asocia o listă de perechi proprietate-valoare, în care 
proprietăţile sunt simboluri, iar valorile — date Lisp. In această listă o proprietate 
poate să apară o singură dată. O listă de proprietăţi are asemănări cu o listă de 
asociaţie (astfel numele de proprietate corespunde cheii, iar valoarea proprietăţii — 
datei) dar există şi diferenţe între ele (în lista de proprietăţi o singură valoare poate fi 
atribuită unei proprietăţi, dar mai multe în lista de asociaţie, ce pot fi regăsite în 
ordinea inversă a atribuirilor). Implementational, o listă de proprietăţi a unui simbol 
este o listă de lungime pară, în care pe poziţiile impare sunt memorate (cu unicitate) 
numele proprietăţilor şi alături de ele, pe poziţiile pare, — valorile acestora. 

Cercetarea valorii unei proprietăți a unui simbol se face prin funcţia get: dacă 
lista de proprietăţi a simbolului s este: (s.. (e1. (... (Sn. (en.nil))...))), atunci, 
dacă sx E€ { S1; 7 Sn}: 

(get ’s 'Sx) >>> ek 
altfel: 
(get ’s 's4) >>> nil 


În cazul în care un al treilea argument e specificat, atunci el indică valoarea 
care se doreşte să înlocuiască valoarea implicit întoarsă nil atunci cand 


proprietatea solicitată nu a fost setată: dacă sx €{Si,..,Sn}: 
(get ’s 's, 'e) >>> e 
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Atribuirea valorii unei proprietăți a unui simbol se face printr-un apel set f în 
care pe poziţia functionalei se folosește get: 


> (setf (get 'a 'pl) 'v1) 
VI 

> (setf (get 'a 'p2) 'v2) 
V2 

> (get 'a 'pl) 

VI 

> (get 'a 'p2) 

V2 


Funcţia remprop îndepărtează o valoare pe de o proprietate a unui simbol. 
Astfel, dacă lista de proprietăţi a simbolului s este: 
1= (sa. (ea. ( (Sx. (ex. (... (Sa. (Qn-nil) )..)))..))), astfel încât: 
(get 's 'S,) >>> ek 
atunci: 
(remprop ’s ’s,) >>> ~nil | 1€ (s1. (e1. (.. (sn. (@n-nil))...))) 


Funcţia symbol-plist întoarce lista de proprietăți a unui simbol: 
Daca lista de proprietăți a simbolului s este: (s1. (e.. (e (Sn. (en.nil))..))), 
atunci: 
(symbol-plist 's) >>> (sa. (e. (... (Sn. (en.nil))..))) 


> (setf (get 'a 'pl) 'v1) 
VI 

> (setf (get 'a 'p2) 'v2) 
V2 

> (symbol-plist 'a) 

(P2 V2 P1 V1) 


2.4.13 Functii chirurgicale 


Funcţiile chirurgicale îşi justifică numele prin faptul că realizează modificări 
asupra argumentele. Ele sunt aşadar funcţii în care efectul lateral este cel care 
primează. 

Funcția ncone modifică toate argumentele (fiecare de tip listă) cu excepția 
ultimului, realizând o listă din toate elementele listelor componente. Astfel, dacă: 

ii = Sia azil age hilt) er So eka sila Oz yn tal) a) 

ln = (en. (n (@nk™.nil)...) ) 

atunci: 

(ncone "Îi... "La la) >>> 

(eps lea lb ese fail Spa sata heaton “ard emi leg a 0 cae 9 Pees. NI 
a >>> (e11. (a (eres (m pi leg analy ede) 


Iaa >>> (eiir Ca Gk ig acetate Veg ea UNA) 


Notatia pune în evidenţă faptul că primele n-1 argumente, din cele n ale 
apelului, vor rămâne modificate în urma apelului. 
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ABC123 UV) 


x< 


> 
( 
> 
( 
> 
( 
> (nconc x y 2) 
( 
> 
( 
> 
( 
> 
( 


Functia rplaca modifica car-ul celulei cons obtinuta din evaluarea primului 
argument la valoarea celui de al doilea argument si intoarce celula cons modificata. 
Dacă: 1 = (e;.e2), atunci: 


(rplaca '1 'e) >>> (e.e2) | 1 = (e.e2) 
> (setq x ‘(a b c)) 
(A B C) 
> (rplaca (cdr x) `d) 
(D C) 
> x 
(A D C) 


Funcţia rplacd modifica car-ul celulei cons obţinută din evaluarea primului 
argument la valoarea celui de al doilea argument şi întoarce celula cons modificată. 
Dacă: 1 = (e1.e2), atunci: 


(rplacd '1 'e) >>> (e,.e) | 1 = (e1.e) 
> (setq x ‘(a b c)) 
(A B C) 
> (rplacd (cdr x) `d) 
(Bey :D} 
> x 
(AB . D) 


Următorul exemplu probează că un apel append copiază toate elementele listelor argument 
cu excepţia ultimului: 


> (setq x '(a b c) y '(d e)) 
(D E) 

> (setq z (append x y)) 
(AB C DE) 

> (rplaca x 'alpha) 
(ALPHA B C) 

> z 

(A B-C D BE) 

> (rplaca y 'beta) 
(BETA E) 

> z 

( 


A BC BETA E) 
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2.4.14 Forme de apelare a altor functii 


Funcţia apply cheamă o funcţie asupra unei liste de argumente. 


> (setq £ '+) 

+ 

> (apply f '(1 2 3)) 

6 

> (apply #'+ '()) 

O 

> (apply #'min '(2 -6 8)) 
-6 


Funcţia funcall aplică o funcţie asupra unor argumente. 


> (cons 1 2) 

(1. = <2) 

> (setq cons (symbol-function '+)) 
#<Function +> 


> (funcall cons 1 2) 

3 

> (funcall #'max 1 2 3 4) 

4 

> (setq x 2) 

2 

> (funcall (if (> x 0) #'max #'min) 1 2 3 4) 
4 

> (setq x -2) 

—2 


Vv 


(funcall (if (> x 0) #'max #'min) 1 2 3 4) 


2.4.15 Lambda expresii 


O lambda-expresie ataşează unui set de parametri formali un corp de funcţie. 
O lambda-expresie poate fi folosită în locul unui nume de funcţie: 
((lambda (Sa... Sk) ca... Gon) Tep... 7Epk) >>> Con | Si epis- SxCew, 
Coiy, [Gen], unbind(si,.., Sx) 


Proceduri uzuale de apel sunt: ca prim argument al unei liste supusa 
evaluării, sau prin intermediul funcţiilor apply, funcall ori map... (a se vedea 
secțiunea următoare). La evaluare, mai întâi argumentele formale ale lambda- 
definiţiei (s....s,) se leagă la valorile actuale evaluate (e,....e,.), apoi formele 
corpului definiţiei (° e.....” ecn) sunt evaluate una după alta. Valoarea întoarsă este 
cea rezultată din evaluarea ultimei forme. Lambda-definitia marchează un context 
(domeniu) lexical (discutat în secțiunea 2.5.5 Variabile şi domeniile lor) pentru 
variabilele locale. 


> ((lambda (x y) (> x y)) 3 2) 
T 
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2.4.16 Lambda-functii recursive® 


Nu putem utiliza o lambda definiţie pentru o funcţie recursivă pentru ca 
lambda-functia nu are nume. Pentru a asocia nume funcţiilor definite ca lambda- 
expresii se foloseşte construcţia labels. Forma unui apel este: 


(labels (<specificatie-legare>*) <apel>*) 


în care fiecare dintre specificaţiile de legare trebuie sa aibă forma: 
(<nume> <parametri> . <corp>) 


adică analog unei definiţii lambda. În interiorul expresiilor din labels, <nume> va 
referi acum o funcţie ca după un apel: 


#' (lambda <parametri> . <corp>) 


> (labels ((inc (x) (1+ x))) (inc 3)) 
4 


În exemplul următor primul argument al lui mapcar este o funcţie recursivă: 


> (defun count-instances (obj l1sts) 
(labels ((instances-in (lst) 
(if (consp lst) 
(+ (if (eq (car lst) obj) 1 0) 
(instances-in (cdr lst))) 
0))) 
(mapcar #'instances-in lsts))) 
COUNT-INSTANCES 
> (count-instances 'a '((a b c) (darpa) (dar) (a a))) 
(2526 Te 2) 


Funcţia primeşte un obiect şi o lista şi întoarce o listă a numărului de apariții a 
obiectului în fiecare element al listei. 


> (labels ((dot-product (a b) 
(if (or (null a) (null b)) 
9) 
(+ (* (car a) (car b)) (dot-product (cdr a) (cdr b)))))) 
(dot-product '(1 2 3) "(10 20 30))) 
140 


Apelul de mai sus cuprinde o definiţie recursivă a produsului scalar al doi 
vectori (daţi ca liste). 


2.4.17 Funcţii de corespondenţă 


Din această categorie fac parte funcţii care aplică o funcţională asupra 
argumentelor construite din listele primite ca parametri. Funcţiile de corespondență, 


Exemplele din această secțiune sînt preluate din (Graham, 1994). 
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exersate corect, formeaza deprinderea de a gandi transformari aplicate unei multimi 
de obiecte, de o manieră globală, iar nu ca iterări asupra elementelor mulțimii. 
Mapcar aplică o funcţie asupra elementelor unor liste: dacă +1. >>> 
(e11. lead ee ID sah ia Cle >>> (en. Glee sa Ilea) ŞI f este o 
funcțională de n argumente (aşadar aritatea functionalei este egală cu numărul 
listelor comunicate ca parametri) şi dacă lungimea celei mai mici liste argument este 


k(k = min (x, , x")), atunci: 


(mapcar ’f 711 .. la) = (list (funcall #’f "e .. len) 


h 


Lă 


(funcall #’f 


Eik ... 1€nk)) 


cu alte cuvinte, valoarea întoarsă de mapcar va fi o listă de lungime k, în care 
fiecare element de rang j (je (1,..., k)) reprezintă valoarea întoarsă de evaluarea 
functionalei £ asupra elementelor de rang j din fiecare din listele din intrare (v. şi 


Figura 2.5). 
> (mapcar ‘equal '(a (b c) de) '(b (b c) f e 3)) 
(NIL T NIL T) 


Următorul apel realizează produsul scalar al doi vectori” dați ca liste de numere: 


> (apply #'+ (mapcar #'* '(1 2 3) '(10 20 30))) 
140 


Următoarea secvenţă intenționează să înlocuiască nume de persoane cu diminutivele lor într- 
un text dat: 


> (setq 1 (pairlis '(Mihai Gheorghe Nicolae Ion) '(Misu Ghita Nicu 
Ionica))) 
((ION . IONICA) (NICOLAE . NICU) (GHEORGHE . GHITA) (MIHAI . MISU)) 
> (mapcar #'(lambda(x) (if (null (assoc x 1)) 
x 
(cdr (assoc x 1)))) 
' (Mihai s-a intilnit cu Mircea ca sa-l viziteze 
impreuna pe Ion)) 
(MISU S-A INTILNIT CU MIRCEA CA SA-L VIZITEZE IMPREUNA PE IONICA) 


Produsul scalar al doi vectori de numere este numărul egal cu suma produselor elementelor de acelaşi rang 
din cei doi vectori: dacă v,= (a;,..., an), V2= (b1p...r Pn), atunci vi. vz=a1*b; +...+ ar*b.. 
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numărul argumentelor = 
aritatea functionalei 


(mapcar /f 


i 
c Bia Bia) | > 


dimensiunea iesirii = 
lungimea listei minime 


Figura 2.5: Evaluarea în cazul unui apel mapcar 


numărul argumentelor = 
aritatea functionalei 


(maplist #'f 


dimensiunea 
ieșirii 


lungimea listei 
minime 


Figura 2.6: Evaluarea în cazul unui apel maplist 


Această implementare suferă de un defect: execuţia este ineficientă pentru ca 
asocierea unui nume într-o listă este făcută de două ori. Vom corecta această 
deficiență în secţiunea dedicată formei ict. 

Maplist — funcţionează asemănător cu mapcar, numai că functionala este 
aplicată listelor şi cdr-urilor succesive ale acestora, în secvenţă: 


> (maplist #'(lambda (x) x) '(1 2 3 4)) 
((1 2 3 4) (2 3 4) (3 4) (4)) 
> (mapcar #'(lambda (x) (cons ‘alpha x)) 
(maplist #'(lambda (x) x) '(1 2 3 4))) 
( (ALPHA 1 2 3 4) (ALPHA 2 3 4) (ALPHA 3 4) (ALPHA 4) ) 
> (mapcar #' (lambda (x) (apply #'+ x)) 
(maplist #'(lambda (x) x) '(1 2 3 4))) 


(10 9 7 4) 
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2.5 Tehnici de programare in Lisp 


2.5.1 Definitii de functii 


Definitia unei functii se face cu constructia defun: 


(defun s (Si... Sk) G1. Gn) >>> s | S€&(lambda(si.. Sx) en... 


en) 


Aşadar, rezultatul unei definiţii de funcţii este crearea unei legări între un 
nume, recunoscut global, — s, o listă de variabile, considerate variabile formale ale 


funcției, — si... sx şi un corp al funcţiei — secvenţa e... ex. 


Deşi neuzuală, este permisă, desigur, definirea de funcţii în interiorul altor 
funcţii. O funcţie definită în interiorul altei funcţii devine cunoscută sistemului însă 


numai după apelarea cel putin o dată a funcţiei in care a fost ea definită: 
> (defun fl () (princ "f1n)) 


> (defun f2() (defun £3() (princ "f3")) (princ "f2")) 


fl 

ss ped les 
> (f2 
f2 
UESN 
So (3) 

£3 

LL ee Aj 

> (defun f4() (defun f5() (princ "f5")) (princ "f4")) 
F4 

Sr (ES) 


[condition type: UNDEFINED-FUNCTION] 
> (£4) 

£4 

TEAM 

>e Ss) 

£5 

"FHN 


2.5.2 Recursivitate 


În Lisp recursia este la ea acasă. lată definiţia functiei factorial: 


> (defun fact (n) (if (zerop n) 1 (* n (fact (1- n))))) 


O strategie, care nu dă greş, de definire a funcțiilor recursive zice aşa: 
- începe prin a scrie condiţia de oprire; 
- scrie apoi apelul recursiv. 


> (defun fact (n) 
(if (zerop n) 0 
(* n (fact (- n 1))))) 


Error: attempt to call `F5' which is an undefined function. 
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FACT 


Orice argument, oricat de mare, poate fi dat acestei functii: 


>(fact 1000) 
402387260077093773543702433923003985719374864210714632543799910429938 
512398629020592044208486969404800479988610197196058631666872994808558 
901323829669944590997424504087073759918823627727188732519779505950995 
276120874975462497043601418278094646496291056393887437886487337119181 
045825783647849977012476632889835955735432513185323958463075557409114 
262417474349347553428646576611667797396668820291207379143853719588249 
808126867838374559731746136085379534524221586593201928090878297308431 
392844403281231558611036976801357304216168747609675871348312025478589 
320767169132448426236131412508780208000261683151027341827977704784635 
868170164365024153691398281264810213092761244896359928705114964975419 
909342221566832572080821333186116811553615836546984046708975602900950 
537616475847728421889679646244945160765353408198901385442487984959953 
319101723355556602139450399736280750137837615307127761926849034352625 
200015888535147331611702103968175921510907788019393178114194545257223 
8655414610628 92187960223838971476088506276862967146674697562911234082 
439208160153780889893964518263243671616762179168909779911903754031274 
622289988005195444414282012187361745992642956581746628302955570299024 
324153181617210465832036786906117260158783520751516284225540265170483 
304226143974286933061690897968482590125458327168226458066526769958652 
682272807075781391858178889652208164348344825993266043367660176999612 
831860788386150279465955131156552036093988180612138558600301435694527 
224206344631797460594682573103790084024432438465657245014402821885252 
470935190620929023136493273497565513958720559654228749774011413346962 
7154228458 62377387538230483865688976461927383814900140767310446640259 
899490222221765904339901886018566526485061799702356193897017860040811 
889729918311021171229845901641921068884387121855646124960798722908519 
296819372388642614839657382291123125024186649353143970137428531926649 
875337218940694281434118520158014123344828015051399694290153483077644 
569099073152433278288269864602789864321139083506217095002597389863554 
277196742822248757586765752344220207573630569498825087968928162753848 
863396909959826280956121450994871701244516461260379029309120889086942 
028510640182154399457156805941872748998094254742173582401063677404595 
741785160829230135358081840096996372524230560855903700624271243416909 
004153690105933983835777939410970027753472000000000000000000000000000 
000000000000000000000000000000000000000000000000000000000000000000000 
000000000000000000000000000000000000000000000000000000000000000000000 
000000000000000000000000000000000000000000000000000000000000000000000 
000000000000000 

> 


Abia un argument exagerat de mare, de genul: 


>(fact (fact 1000)) 


ne poate cauza neplăceri (atunci când interpretorul utilizat nu este unul comercial): 


Error: An allocation request for 1080 bytes caused a need for 2883584 
more bytes of heap. This request cannot be satisfied because you have 
hit the Allegro CL Trial heap limit. [condition type: STORAGE- 
CONDITION] 
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Recursivitate coada® 


Se spune că o funcţie este coadă-recursivă daca, dupa apelul recursiv, nu 


mai are nimic de făcut. Următoarea funcţie e coadă-recursivă: 


> (defun our-find-if (fn lst) 
(if (funcall fn (car lst) 


(car lst) 


(our-find-if fn (cdr lst)))) 


pentru că funcţia întoarce direct valoarea apelului recursiv. Următoarele funcţii nu 


sunt coadă-recursivă: 


> (defun our-length (lst) 
(if (null lst) 
0) 


(1+ (our-length (cdr 1st))))) 


> (defun suma (lst) 
(if (null lst) 0 


(+ (car lst) (suma (cdr lst))))) 


pentru că rezultatul apelului recursiv este transferat, într-un caz lui 1+ şi, in celălalt 


caz, funcţiei de adunare +. Nici funcţia : 


recursivă. 


Factorial, definită mai sus, nu e coadă- 


Recursivitatea coadă este căutată pentru că multe compilatoare Common 
Lisp pot transforma funcţii coadă-recursive în bucle (iterații). O funcţie care nu e 
coadă-recursivă poate adesea fi transformată într-una care e coadă recursivă prin 
scufundarea în ea a unei alte funcţii ce conţine un argument acumulator (ce 
păstrează valoarea calculată până la un moment dat). 


Scrierea funcțiilor cu recursivitate coadă prin parametru acumulator 


Următoarea funcţie întoarce lungimea unei liste: 


> (defun tail-length (lst acc) 


(if (null lst) acc 


(tail-length (cdr lst) (1+ acc)))) 


Functia de adunare a elementelor unei liste, de mai sus, scrisa in varianta cu 


registru acumulator: 


> (defun sumal (lst ac) 
(if (null lst) ac 
(sumal (cdr lst) 
> (sumal '(1 2 3 4 5) 0) 
O[1]: (SUMAL (1 2 3 4 5) 
1[1]: (SUMA1 (2 3 4 5) 
2[1]: (SUMAL (3 4 5) 
3[1]: (SUMA1 (4 5) 
4[1]: (SUMA1 (5) 


O parte din exemplele acestei sectiuni sint preluate din (Graham, 1994). 


(+ ac (car lst))))) 


0) 
1) 
3) 
6) 
10) 
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] (SUMA1 NIL 15) 
] returned 15 
4[1]: returned 15 
3[1]: returned 15 
2[1]: returned 15 
1[1]: returned 15 
O[l]: returned 15 
15 


J 
1 


Apelul acestei funcţii trebuie încapsulat într-un alt apel care să initializeze 
acumulatorul: 


> (defun suma (lst) 
(sumal lst 0)) 


Acelasi lucru poate fi insa realizat cu ajutorul lui labels astfel incat functia 
recursivă să fie ascunsă în interiorul alteia care nu afişează argumentul acumulator. 
In acest fel "bucătăria" apelului recursiv nu se manifestă la suprafață: 


> (defun our-length (lst) 


(labels ((rec (lst acc) 
(if (null lst) 
acc 
(rec (cdr lst) (1+ acc))))) 


(rec lst 0))) 


2.5.3 Forme de secventiere 


progn este o forma al carei scop este pur si simplu acela de a evalua intr-o 
secvenţă o succesiune de forme Lisp în vederea întoarcerii ultimei valori: 


(DEO “ers egr) >>> 6h || Errele] 


prog1 se comportă la fel ca progn, cu deosebirea că valoarea întoarsă este 
cea a primei forme din cuprinderea sa: 


(progl ee TEx) >>> 1 | [ ali per n 


Utilizând formele progn şi progl se pot realiza mai multe evaluări în 
contexte sintactice în care doar o singură formă este permisă (ca de exemplu, toate 
cele trei poziții ale argumentelor formei i£). Este clar că rostul utilizării unui prog1 
într-o definiție de funcţie este acela de a întoarce o valoare înainte efectuării unor 
evaluări care sunt importante numai prin efectele lor laterale. 


2.5.4 Formele speciale let şi let* 


Forma let oferă un mijloc de a defini variabile a căror semnificaţie să fie 
aceeaşi într-o anumită întindere de program. Rostul ei este, aşadar, de a defini 
domenii lexicale şi de a preciza legări (despre domenii vom vorbi pe larg în 
secțiunea următoare). Cel mai frecvent tip de apel al formei let are forma: 
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(let ((Si eir) (Sn '@in)) lecie’ ck) >>> eck | City, Cine Si€eiill...ll 
Sn& ein, Gc1y, [eck], unbind (s1,..., Sn) 


In acest apel, s:..s, sunt variabile locale, ’e:;...’ei, sunt expresii care, 
evaluate, configurează valorile inițiale pe care le iau variabilele înainte de evaluarea 
în secvenţă a expresiilor  e.....” e... Valoarea întoarsă de let este cea a ultimei 
expresii, e. 

Definiţia de mai sus caută să surprindă, în secţiunea de efecte laterale, 
secvenţa evaluărilor, cu precădere faptul că evaluarea secvenţei ’ e.....” e. se face 
în contextul initial al legărilor variabilelor si,...,s, la valorile iniţiale eii,..., ein, 
legările fiind făcute în paralel după ce valorile inițiale au fost evaluate serial. Aceste 
legări sunt însă „uitate” la ieşirea din formă. Într-adevăr, dincolo de graniţa acestei 
construcții, semnificaţia variabilelor locale, ca şi legările realizate, se pierd. Notatia 
noastră mai comunică şi ideea că valoarea întoarsă este într-adevăr acel esx, obținut 
la un anumit moment în secvenţa evaluărilor, după care contextul legărilor este uitat. 

Legarea simultană a variabilelor la valori face posibilă schimbarea între ele a 
valorilor a două variabile fără intermediul unei a treia variabile care să memoreze 
temporar valoarea uneia dintre ele: 


> (let ((x 'a) (y 7b)) (prinl x) (prinl y) 
(let ((x y) (y x)) (prinl x) (prinl y))) 

ABBA 

A 


Folosind forma let putem eficientiza solutia exercitiului cu diminutive dat mai 
SUS: 


> (mapcar #'(lambda(x) (let ((temp (assoc x 1))) 
(if (null temp) x (cdr temp) ))) 
' (Mihai s-a intilnit cu Mircea ca sa-l viziteze 
impreuna pe Ion) ) 
(MISU S-A INTILNIT CU MIRCEA CA SA-L VIZITEZE IMPREUNA PE IONICA) 


Forma let* este similara formei let, cu deosebirea ca legarea variabilelor 
la valori este făcută serial. Cel mai frecvent tip de apel al formei let * are forma: 
(let? “Glsa; Teun) (Sr eid) Sees" Ga) Sem See. |) ery Ssi Say aig 
Cin, Sn© Cin, Cory, [Eck], unbind (s1),.., unbind (sy) 


Desigur, cu let * rezultatul permutării de valori de mai sus nu se mai păstrează: 


> (let ((x ’a) (y ’b)) (prinl x) (prinl y) 
(let* ((x y) (y x)) (prinl x) (prinl y))) 

ABBB 

B 


Exemplele care urmeaza pun in evidenta diverse domenii create cu let si 
let*: 


> (let ((x 1)) (prinl x) 
(let ((x 2) (y x)) (prinl x) (prinl y)) 
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(prinl x)) 

1211 

1 

> (let ((x 1)) (prinl x) 
(let* ((x 2) (y x)) (prinl x) (prinl y)) 
(prinl x)) 

1221 


i 
2.5.5 Variabile şi domeniile lor 


În Lisp noţiunea de variabilă, atât de comună în alte limbaje de programare, 
înțeleasă ca asocierea dintre un nume simbolic, un tip şi un spaţiu de memorie unde 
poate fi depozitată o valoare, trebuie privită oarecum diferit. Vom continua să numit 
variabilă un simbol care apare în codul programului cu intenţia ca lui să i se 
asocieze valori. Mai întâi, aşa cum am arătat deja (v. secţiunea 2.3 Tipuri de date în 
Lisp), variabilele nu au tipuri. Apoi, nu este cazul ca o variabilă să definească un 
spațiu de memorie care să fie ocupat de o valoare. Aici, simbolului care dă numele 
variabilei i se poate asocia o valoare. 

Un număr de fome ale Lisp-ului (printre ele: defun, lambda, let, let*, do, 
dolist, dotimes etc., adică acele forme ce permit definirea de parametri locali) 
creează domenii (sau întinderi) ale variabilelor ce apar pe post de parametri locali în 
aceste forme. Un domeniu este un spațiu lexical contiguu, mărginit de perechea 
de paranteze care „îmbracă” o formă, ce evidenţiază o listă de parametri locali. La 
orice moment funcţionează următoarea regulă de legare: valoarea unei variabile 
este dictată de ultima legare ce a avut loc în cel mai adânc domeniu care cuprinde 
variabila în lista de parametri locali ai săi. Dacă nu există nici un domeniu care să 
numere variabila printre parametrii săi atunci variabila e considerată globală şi 
legarea se face în domeniul de adâncime zero, cel al expresiilor evaluate la 
prompter. 

Astfel, in Figura 2.7 sunt schitate trei domenii, în afara celui global (considerat 
de adâncime zero): cel exterior (sau de adâncime unu), notat cu A, care defineşte ca 
locale variabilele x, u şi w, şi două domenii de adâncime doi, notate B şi respectiv C, 
care au ca variabile locale, B pe x şi y iar C pe x, z şi u. În contextul domeniului B 
valorile variabilelor referite sunt: pentru x şi y — cele legate în acest context, pentru u 
— cea legată în contextul A si pentru z — cea definită în contextul global. În contextul 
domeniului A, în continuare sunt referite variabilele: x — cu valoarea legată în 
contextul A şi v — cu valoare globală. În sfârşit, în domeniul c sunt referite 
variabilele: x, z şi u — cu valorile date de legările domeniului C, şi w — cu legarea din 
contextul domeniului A. O variabilă care nu este definită ca locală într-un domeniu se 
spune că este liberă în acel domeniu. Astfel, de exemplu, domeniul A conţine 
variabila liberă v, domeniul B — variabilele u şi y, iar domeniul c — variabila w. 


Figura 2.7: Domenii lexicale incluse 
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Teoretic, exista doua modalitati prin care putem sa asociem o valoare unei 
variabile ce nu este parametru local al unei functii: prin legare statică şi prin legare 
dinamică. In legarea statică, valoarea unei astfel de variabile este stabilită de 
contextul lexical (întinderea de program) în care este ea folosită, pe când în legarea 
dinamică atribuirea valorii rezultă în urma execuţiei. O valoare a unei variabile legată 
lexical poate fi referită numai de forme ce apar textual în interiorul construcției ce a 
produs legarea. O astfel de legare impune aşadar o limitare spaţială, iar nu una 
temporală, a domeniului unde referința se poate realiza în siguranţă. Dimpotrivă, o 
valoare a unei variabile legată dinamic poate fi referită în siguranță în toate 
momentele ulterioare legării pe parcursul evaluării formei în care a fost efectuată 
legarea. Ca urmare ea impune o limitare temporală asupra apariției referintelor iar 
nu una spaţială. 

Tipul de legare considerat implicit în Common Lisp este cea statică, deşi nu 
întotdeauna lucrurile au stat aşa. Intr-adevar în multe implementări anterioare ale 
Lisp-ului (ca de exemplu, realizările româneşti DM-LISP (Giumale et al., 1987) şi 
TC-LISP (Tufis, 1987) (Tufiş, Popescu, 1987)) se optase pentru o legare dinamică. 
Legarea statică este o trăsătură a majorităţii limbajelor moderne şi ea asigură o mai 
mare rezistenţă la erori programelor. O strategie de legare în care valorile atribuite 
variabilelor să depindă de firul curent al execuţiei a constituit, la un moment dat, o 
alternativă de implementare atrăgătoare, din cauza posibilităţilor mai bogate, 
aproape exotice, de comunicare a valorilor variabilelor în timpul execuţiei, pe care 
această opţiune le oferea. Experienţa a arătat însă că un astfel de comportament 
predispunea la erori şi, ca urmare, standardul Common Lisp, fără a-l invalida, nu îl 
recomandă. El poate fi ales explicit de utilizator printr-o declaraţie special (v. cap. 
9 Declarations în (Steele, 1990). 


> (defun F1() 


(let ((x 'a)) 
(defun F2() 
(prinl x) 
) 
) 
) 
Fl 
> (F1) 
F2 
> (let ((x 'b)) (F2)) 
A 
A 


Exemplul doreste sa evidentieze cele doua posibilitati de legare ale variabilei 
x. Definitia functiei F1 cuprinde o legare a simbolului x la valoarea a urmata de o 
definitie a functiei F2, in care valoarea lui x este tiparita. Corpul definitiei functiei F2 
creeaza un domeniu pentru x. In F2 variabila x nu este parametru formal si deci aici 
nu avem un nou domeniu pentru x. Definiţia funcţiei F2 are loc odată efectuat apelul 
lui F1. Mai departe are loc apelul lui F2 într-un context în care x este legată la 
valoarea b (domeniu precizat de forma let, ce va fi prezentată în secțiunea 
următoare). Un comportament tipic legării dinamice ar trebui să producă tipărirea 
valorii B, pentru că simbolul x era legat la această valoare înainte de apelul funcţiei 
F2 în care are loc tipărirea. Faptul că valoarea tipărită este însă A semnalează un 
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comportament tipic legării statice, adică unul în care simbolul x din contextul formei 
let este „altul” decât cel din corpul definiţiei lui F2. Pentru alt exemplu v. şi (Graham, 
1994), p. 16. 


2.5.6 Legări versus asignări 


Chestiunile discutate până acum probează că există două maniere în care o 
variabilă poate căpăta o valoare: prin legare (exemplu: let) şi prin asignare 
(exemplu: setq). Orice construcție care leagă o variabilă la o noua valoare salvează 
vechea valoare, dacă noul domeniu este inclus într-unul vechi, astfel încât la ieşirea 
din construcţia care a produs noua legare variabila revine la vechea valoare. 
Exemplul următor lamureste: 


> (let ((x 'a)) (prinl x) (let ((x 'b)) (prinl x)) (prinl x)) 

ABA 

A 

> (let ((x 'a)) (prinl x) (let () (setq x 'b) (prinl x)) (prinl x)) 
ABB 


> (let ((x 'a)) (prinl x) (let ((x 'b)) (setg x Te) (prinl x)) (prinl 
x) ) 

ACA 

A 


A În primul exemplu, avem două domenii incluse unul în altul, pentru variabila x. 
In domeniul exterior x se leagă la valoarea A, la intrarea în domeniul interior x se 
leagă la valoarea B, iar la ieşirea din acesta revine la vechea valoare — B. 

In exemplul al doilea, x este liber în domeniul interior, dar îi este asignată 
acolo valoarea B. La ieşirea din acest domeniu, care nu este al său, e normal ca x 
să păstreze această valoare. 

In al treilea exemplu, x este legat din nou în ambele domenii şi, ulterior legării 
interioare la valoarea B, îi este asignată o a treia valoare — C. La revenirea în 
domeniul exterior, x recapătă valoarea la care era legat acolo — A. 


Valoarea pe care o poate avea o variabilă când nu s-a realizat nici o legare 
explicită a ei se consideră globală. O valoare globală poate fi dată numai prin 
asignare. 


Definiţie. Un simbol s apare liber într-o expresie când e folosit ca variabilă în acea 
expresie dar expresia nu creează o legare pentru el. Astfel, în exemplul următor, w, 
x şi z apar libere în list iar w şi y apar libere în let: 


(let ((x yy (z 10)) (list w x z)) 


Despre o variabilă care este liberă într-un domeniu, precum şi în toate 
domeniile care-l înglobează pe acesta, şi care nu are asignată o valoare în domeniul 
global vom spune că e nelegată (unbound). 

In secţiunea 2.4.2 Asignarea unei valori unui simbol discutam modalităţi 
diferite de interpretare a unei notații de genul x:=y. Aparent cea mai simplă, prima 
interpretare discutată este în realitate cea mai subtilă: ea dorea ca variabila x să 
primească valoarea pe care o are variabila y, după care ele să aibă „vieţi” separate, 
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în sensul că orice modificări efectuate asupra uneia să nu se resfranga şi asupra 
celeilalte. Să observăm că nici asignarea simplă, de genul (seta x y), şi nici 
legarea, de genul (let* ((y ...) (x y))...) nu realizează acest deziderat 
pentru că există pericolul ca modificările asupra uneia dintre variabile să fie 
rezultatul intervenţiei unei funcţii chirurgicale (v. secțiunea 2.4.13 Funcţii 
chirurgicale), caz în care ea ar fi resimţită de ambele variabile. Am avea aşadar cel 
de al doilea comportament comentat, care este unul în care cele două variabile 
devin „surori siameze”. Pentru a realiza primul efect este necesară copierea valorii 
simbolului y ca valoare a lui x. Common-Lisp dispune de mai multe funcții de 
copiere. Astfel dacă y este o listă, putem scrie: (setq x (copy-list y)). În 
ultima interpretare variabilei x i se atribuie ca valoare însuşi simbolul y: (seta x 


Lă y) ; 
2.5.7 Forme de iterare 


dolist itereaza aceleasi evaluari asupra tuturor elementelor unei liste. Daca 
1 = (e1. (..(ex.nil)..)), atunci: 


(dolist (s 71 7e) leege leon) >>> e | Seq, Coty -y Cony np SEC, 
Scl -r Cons [e] unbind (s) 


> (dolist (x '(a b c d) 'exit) 
(prinl x) 
(rine ™ 4) 
) 
A-B-C D 
EXIT 


Într-o altă formă a apelului, valoarea întoarsă poate fi ignorată: 


(dolist (s 71) ess Tean) >>> nil | S€ey, Cop eey Cony ony SEEK, 
€c1r -7 Gon, [Nil], unbind (s) 


dotimes itereaza aceleaşi evaluări de un număr anumit de ori: Dacă n>0, 
atunci: 


(dotimes (s ’n 7e) "ecr esa) >>> e | S€&O0, ctype, Cony ey 


s€n-1,ee1,.., Gen, SEn, [e], unbind (s) 


> (dotimes (x 4 x) 
(prinl x) 
(princ " ") 


Intr-o alta forma a apelului, valoarea intoarsa poate fi ignorata: 
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(dotimes (s n) lee. e€) >>> nil | s€0,eo1,., Conr- 


s€n-1,€e1,..,@cn, [nil], unbind (s) 


Forma do reprezintă maniera cea mai generală de a organiza o iteratie în 
Lisp. Ea permite utilizarea unui număr oarecare de variabile si controlarea valorilor 
lor de la un pas al iteratiei la următorul. Forma cea mai complexă a unui apel do 
este: 


(do ( (Sa Tes "@s1) (Sn "Cin "@sn) ) G t "Er... d rp) í Cle d eq) 
>>> erp | City, Cine SiC eal... so€ein, while (not e) 
{Gc1, m=, Ecar Es1r r Esnr S1&es1 l.ll sn €esn}, eri,, [erp], unbind (s1,..., Sn) 


Primul element al formei este o lista definind variabilele de control ale buclei, 
valorile lor de initializare si de incrementare. Astfel, fiecărei variabile îi corespunde o 
listă formată din numele variabilei, eventual valoarea iniţială şi, când aceasta apare, 
eventual o forma de incrementare a pasului. Dacă expresia de initializare e omisă, 
ea va fi implicit considerată nil. Dacă expresia de incrementare este omisă, 
variabila nu va fi schimbată între paşii consecutivi ai iteratiei (deşi corpul lui do poate 
modifica valorile variabilei prin setq). 

Înainte de prima iteratie, toate formele de initializare sunt evaluate şi fiecare 
variabilă este legată la valoarea de initializare corespunzătoare (acestea sunt legări 
iar nu asignări, astfel încât după ieşirea din iteratie, variabilele revin la valorile la 
care erau legate înainte de intrarea în iteratie). 

La începutul fiecărei iterații, după procesarea variabilelor, o expresie de test 
e, este evaluată. Dacă rezultatul este nil, execuţia continuă cu evaluarea formelor 
din corpul do-ului: ec1,..., eca. Dacă e. este diferită de nil se evaluează în ordine 
formele e......, rp, ultima valoare fiind şi cea întoarsă de do. 

La începutul oricărei iterații, cu excepţia primei, variabilele sunt actualizate 
astfel: toate formele de incrementare sunt evaluate de la stânga la dreapta şi 
rezultatele reprezintă valorile la care sunt legate variabilele în paralel. 

În cazul formei do*, evaluarea formelor de initializare urmată de legarea 
variabilelor la aceste valori, atât la initializare cat şi la fiecare ciclu al iteratiei, se 
efectuează serial: 

(do* ( (Sa "ei "@s1) ... (Sn ’ Cin Á Esn) ) (G t d rie s rp) clee eq) 
>>> erp | Cir, Si eiiy.., in, Sn€ Cin, While (not et) {€c 
Ecar Es1r si€esi, wey Esnr SnCesn) pr Orire [erp ] [A unbind (Si,.., Sn) 


Exemplele urmatoare exploateaza legarile paralele ale variabilelor de index: 


(defun list-reverse (lst) 
(do ((x lst (cdr x)) 
(y '() (cons (car x) y))) 
((endp x) y))) 


od 
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Funcţia list-reverse’, realizează inversarea unei liste. Variabila de ciclu x se 
leagă la liste din ce în ce mai scurte din cea iniţială, Ist, în timp ce variabila y pleacă 
de la lista vidă şi adaugă la fiecare iteratie primul element al listei x. Când x ajunge 
la lista vidă do se termină întorcând valoarea acumulată în y. 


(defun rev (lst) 
(cond ((null lst) nil) 
((null (cdr lst)) lst) 
(t (do ((z (cddr lst) (cdr z)) 
(y (cdr lst) z) 


(x (progn() (rplacd lst nil) lst) y)) 
( (null z) (rplacd y x) y) 
(rplacd y x))))) 


Funcţia rev definită aici realizează, de asemenea, inversa unei liste, dar, spre 
deosebire de exemplul precedent, nu se consumă alte celule de memorie fata de 
cele în care era memorată lista dată în intrare. Cu alte cuvinte, lista se inversează 
“n ea însăşi”. Primele două clauze cond tratează lista vida si lista formată dintr-un 
singur element. Orice listă care are minimum două elemente este preluată de do. 
Variabilele x, y si z tin minte la fiecare ciclu trei celule cons aflate în secventa în lista 
inițială. La initializare, cdr-ul celulei de pe prima poziție (indicată de x) este facut nil 
pentru a realiza sfarsitul de lista. Operatia efectiva a fiecarui pas, realizata pe ultimul 
rand al definitiei de functie, consta in modificarea partii cdr a elementului din mijloc 
(y) pentru a indica elementul precedent (x). După realizarea operaţiei din ciclu, 
variabilele îşi transferă una alteia valorile în paralel mutându-se toate cu câte un 
element mai spre sfârşitul listei iniţiale. Când ultima variabilă (z) devine nil înseamnă 
că y indică ultimul element al vechii liste, ca urmare însăşi cdr-ul acesteia este 
modificat la elementul precedent şi se întoarce valoarea indicată de ea, care 
reprezintă acum capătul listei inversate. 


2.5.8 Valori multiple şi exploatarea lor 


După cum s-a putut vedea, o seamă de funcții, printre care floor şi 
ceiling, întorc valori multiple. O generare explicită de valori multiple se poate face 
cu formele values-list şi values: 


(values-list (list 'a 'b 3 'c)) 


> 
A 
B 
3 
C 
> (values ‘a 'b 3 'c) 
A 
B 
3 
C 


Diferența dintre ele este că prima solicită o listă pe când a două primeşte 
valorile pe care le “multiplică” ca simple argumente. 

Cea mai simplă metodă de exploatare a valorilor multiple constă în 
transformarea lor în liste. Forma multiple-value-list face acest lucru: 


Exemplu preluat din (Steele, 1990). 
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> (multiple-value-list (ceiling 7 3)) 
(B5=2) 


Se observa că values-list şimultiple-value-list sunt inverse una alteie: 


> (multiple-value-list (values-list (list 'a 'b 3 'c))) 
(A B 3 C) 


> (values-list (multiple-value-list (ceiling 7 3))) 
3 
-2 


Forma multiple-value-call transferă valori multiple, ca argumente, unui 
apel de funcție. Functionala care asamblează valorile multiple trebuie data ca prim 
argument al apelului: 


> (multiple-value-call #'list 1 (ceiling 7 3) (values 5 6) 'alpha) 
(1 3 -2 5 6 ALPHA) 


O formă (macro) care produce legări (generează domenii) prin exploatarea 
valorilor multiple este multiple-value-bind. Sintaxa (simplificată) este 
următoarea: 


(multiple-value-bind ({var}*) values-form {form}*) >>> {result}* 


în care var reprezintă un nume de variabilă, values-form este o formă care 
generează valori multiple, iar form reprezintă corpul în care legările sunt 
valorificate. Ultima formă evaluată generează valoarea/valorile întoarsă/întoarse de 
macro. 


> (multiple-value-bind (x y) (ceiling 7 3) (list x y)) 
(3. —2)) 


2.5.9 inchideri’® 


Combinatia dintre o funcţie şi un set de legari de variabile libere ale functiei la 
momentul apelului acelei funcţii se numeşte închidere (closure). Inchiderile sunt 
funcţii împreună cu stări locale. În exemplul următor, se defineşte o închidere la 
nivelul apelului lui mapcar, pentru care n este o variabilă liberă. Ea dispare la nivelul 
definiţiei funcţiei 1ist+: 


> (defun list+ (lst n) 
(mapcar #'(lambda (x) (+ x n)) 
lst) ) 


> (list+ '(1 2 3) 10) 
(11 12 13) 


19 Exemplele din aceasta sectiune sint preluate din (Graham, 1994). 
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Următoarele funcţii folosesc împreună o variabilă comună ce serveşte de 
numărător. Inchiderea contorului într-un let în loc de a-l considera o variabilă 
globală îl protejează asupra referirilor accidentale. 


> (let ((counter 0)) 
(defun new-id () (incf counter)) 
(defun reset-id () (setq counter 0))) 


În următorul exemplu avem o funcţie care la fiecare apel întoarce o funcţie 
împreună cu o stare locală: 


> (defun make-adder (n) 
+! (lambda (x) (+ x n))) 


> (setq add2 (make-adder 2) 
add10 (make-adder 10) ) 

#<Interpreted-Function BF162E> 

> (funcall add2 5) 

7 

> (funcall add10 3) 

1.3 


Funcția make-adder primeşte un număr şi întoarce o închidere, care, atunci când e 
chemată, adună numărul la argument. În această variantă în închiderea întoarsă de 
make-adder starea internă e constantă. Următoarea variantă realizează o 
închidere a cărei stare poate fi schimbată la anumite apeluri: 


> (defun make-adder-b (n) 
+! (lambda (x optional change) 
(if change (seta n x) (+ x n)))) 
> (setq addx (make-adder-b 1)) 
#<Interpreted-Function BF1C66> 
> (funcall addx 3) 
4 
> (funcall addx 100 t) 
100 
> (funcall addx 3) 
103 


2.5.10 Transferul argumentelor in functii 


In transferul prin valoare (Figura 2.8), inaintea evaluarii functiei, valorile 
actuale ale parametrilor se copiaza ca valori ale parametrilor formali ai functiei. 
Modificari ale valorilor parametrilor formali in timpul evaluarii functiei nu afecteaza 
valorile parametrilor actuali: 
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a v1 
x: | v1 în momentul apelului 
x: | v2 în timpul evaluării lui F 


Figura 2.8: Transferul prin valoare, în general 


În transferul prin referință (Figura 2.9) numele parametrilor formali 
reprezintă sinonime ale numelor parametrilor actuali. Modificarea valorilor 
parametrilor formali în timpul evaluării funcției provoacă astfel o schimbare a însăşi 
valorilor parametrilor actuali. Această modificare reprezintă, aşadar, un efect lateral 
al evaluării funcției: 


F(a) a: | vi 


xia: | vl în momentul apelului 


x:a: | v2 în timpul evaluării lui F 


Figura 2.9: Transferul prin referință, în general 


Transferul în Lisp nu se face nici prin valoare nici prin referință, dar ambele 
tipuri pot fi simulate. In Lisp un parametru formal se leagă la valoarea comunicată 
prin parametrul actual. Atunci când, în interiorul funcţiei, are loc o asignare a unei 
noi valori variabilei formale, ea este dezlegată de la valoarea veche şi legată la una 
nouă (Figura 2.10). 


(defun F(x) x în momentul apelului 
(setq x v2) 


) x (2) în timpul evaluării lui F 


Figura 2.10: Transferul prin valoare în Lisp 
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Comportamentul este, aşadar, acela al unui transfer prin valoare atât timp cât 
în corpul funcţiei se realizează numai deasignări ale valorilor parametrilor formali. 
Îndată însă ce în corpul funcției au lor modificări “chirurgicale” ale valorii parametrilor 
formali, funcţionarea capătă trăsăturile unui transfer prin referință (Figura 2.11) 
pentru că în acest mod parametrul actual „simte” transformările structurii accesate 
temporar prin parametrul formal. 


Se oe 
| 


(defun F(x) x’ în momentul apelului x în timpul evaluării lui F 


(rplaca x v2) 


) 


Figura 2.11: Transferul prin referință în Lisp 


2.6 Macro-uri 


2.6.1 Definiţie, macroexpandare şi evaluare 


Un macro este în esenţă o funcţie care defineşte o funcţie. Macro-urile sunt 
şi mijloace prin care sintaxa Lisp-ului poate fi extinsă. Evaluarea apelurilor de 
macro-uri este un proces în doi paşi: întâi o expresie specificată în definiţie este 
construită, apoi această expresie este evaluată. Primul pas — cel al construirii 
macro-expresiei se numeşte macroexpandare. 

O definiţie de macro, analog unei definiţii de funcţie, conţine trei elemente: un 
simbol care dă numele macro-ului, o listă de parametri şi corpul. 

Intr-un apel de funcţie definită de utilizator, parametrii actuali sunt evaluati 
înainte ca parametrii formali din definiţie să se lege la aceştia. Rezultă că o evaluare 
diferențiată a parametrilor nu poate fi realizată printr-o definiţie de funcţie. Toate 
formele Lisp-ului în care parametrii se evaluează diferențiat sunt realizate intern ca 
macro-uri. Dacă ar fi să realizăm o funcţie care să aibă comportamentul unui if, de 
exemplu, utilizând însăşi forma if pentru aceasta, o definiție precum următoarea: 


> (defun my-if (test expr-da expr-nu) 
(if test expr-da expr-nu)) 


nu satisface, pentru că la intrarea în funcţie toţi cei trei parametri sunt evaluati. 
Astfel, într-un apel în care am dori să atribuim variabilei x valoarea DA sau NU, în 
funcție de un argument, de genul (my-if t (seta x 'da) (seta x ‘nu)), Cu toate 
că testul se evaluează la T, x ar fi întâi setat la DA şi apoi la NU, el rămânând în cele 
din urmă cu această valoare. Apelul de funcţie întoarce însă valoarea celui de al 
doilea parametru: 
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> (my-if t (setq x 'da) (setq x ‘’nu)) 
DA 
> x 
NU 


Un apel de macro poate include un alt apel de macro. Evaluarea unui apel al 
acestuia produce, mai intai, expandarea lui, generand inclusiv un apel al macro-ului 
interior. Urmează apoi faza de evaluare propriu-zisă a macro-ului exterior în care, la 
un moment dat, se lansează evaluarea macro-ului interior. Ca urmare, la rândul lui, 
acesta mai întâi se expandează şi, într-o a doua fază abia, se evaluează. Procesul 
poate continua în acelaşi mod pe oricâte niveluri de apeluri de macro-uri în macro- 
uri, ceea ce presupune inclusiv posibilitatea de a scrie definiţii de macro-uri 
recursive. 

Macroexpandările au loc la momente diferite în diverse implementări. 
Comportamentul descris mai sus este tipic unei implementări de genul 
interpretorului. Acesta aşteaptă momentul evaluării apelului de macro pentru a face 
macroexpandarea macro-ului. Aceasta înseamnă că orice macro trebuie definit 
înaintea codului care se referă la el şi că dacă un macro este redefinit, orice funcţie 
care referă macro-ul trebuie de asemenea redefinită. 

Un compilator va efectua toate macroexpandările la momentul compilării. Un 
apel de macro ce apare în corpul definiţiei unei funcţii va fi expandat la momentul 
compilării funcţiei, dar expresia (sau codul obiect rezultat) nu va fi evaluată până ce 
funcția nu e chemată. Rezultă că un compilator nu are cum trata apeluri recursive de 
macro-uri, pentru că el are tendinţa de a expanda apelul interior înainte de evaluare, 
ceea ce duce la un alt apel de macro, care trebuie şi el expandat ş.a.m.d., făcând 
astfel imposibilă controlarea acestui proces. 


> (defmacro nthb (n lst) 


“(if (= ,n 0) (car ,lst) (nthb (= „n 1) (cdr ,lst)))) 
NTHB 
> (nthb 2 '(a bcd e)) 
Œ 
> (defmacro fact (n) 
“(if (zerop „n) 1 (* „n (fact (= „n 1))))) 
FACT 
> (fact 4) 
24 


Este important să facem distincția dintre aceste două momente, respectiv 
obiectele asupra cărora operează ele, în evaluarea unui macro: pasul 
macroexpandarii operează cu expresii, cel al evaluării — cu valorile lor. 


2.6.2 Despre apostroful-stânga (backquote) 


Un apostrof-stanga (`) construieşte o formă Lisp conform modelului 
(template) care urmează după el. Sintactic, el prefixează o listă. La evaluare orice 
formă a listei va fi copiată, cu excepția: 

- formelor prefixate de virgulă (, ), care sunt evaluate; 
- unei liste prefixata de o secvenţă virgulă-at (, @), care provoacă inserarea 
elementelor listei. 
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> (setq b 'beta d 'gamma) 
GAMMA 

"(a ,b c ,d) 

A BETA C GAMMA) 

(setq x ‘(a b c)) 


Apostroful-stânga însuşi poate fi copiat într-o expresie prefixată cu apostrof- 
stânga: 


(setq x '(a b c)) 
A B C) 
“(a SDax) 


> 
( 
> 
(A `B (A B C)) 


Putem acum relua definiţia unui macro cu comportamentul lui i £: 


> (defmacro my-if (test expr-da expr-nu) 
` (if „test ,expr-da ,expr-nu)) 

MILE 

> (my-if t (setq x 'da) (setq x 'nu)) 

DA 

> x 

DA 


Restrictii privind folosirea virgulei şi a virgulei-at: 
e virgula poate să apară numai în interiorul unei expresii prefixate cu 
apostrof-stânga: 


> "(a , (cons „x '(alpha beta)) ,x) 
Error: Comma not inside a backquote. [file position = 12] 


e pentru ca elementele unei liste să fie expandate prin virgulă-at, locul 
acesteia trebuie să fie într-o secvenţă. E o eroare a se scrie la prompter: 
rX 

e obiectul de inserat trebuie să fie o listă, cu excepția cazului în care apare 
ca ultim element într-o lista. Astfel expresia ` (a ,@1) se va evalua la (a 

1), dar ` (a ,@1 b) va genera un mesaj de eroare. 
Virgule-at se folosesc cu predilecție în definițiile macro-urilor cu un număr 
nedefinit de argumente. 


2.6.3 Asupra manierei de construcție a macro-urilor™ 


Se începe prin a scrie un apel al macrou-lui ce se doreşte a fi definit, urmat 
de expresia în care se doreşte ca acesta sa fie expandat. Din apelul de macro se 
construiește lista de parametri alegând câte un nume pentru fiecare argument. Intre 


N Exemplele din această secțiune şi următoarele sunt reproduse din (Graham, 1994). 
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rândul apelului şi cel al expandării se trasează săgeți între argumentele 
corespunzătoare (Figura 2.12). 


apelul 


4 


(defmacro memq (obj lst) definitia 
“(member ,obj ,lst :test #’eq)) 


Figura 2.12: Reguli de dezvoltare a macro-urilor 


Cazul unui macro cu un număr oarecare de argumente vom începe, la fel, 
prin a scrie un eşantion de apel de macro. Plecând de la acesta, construim lista de 
parametri ai macrou-lui, dar în care, în afară de parametrul care realizează testul, 
vom descrie corpul macro-ului printr-un parametru «rest sau «body. 

Să presupunem că vrem să scriem un while care primeşte un test şi un corp 
format dintr-un număr oarecare de expresii. Evaluarea lui va însemna buclarea 
expresiilor corpului atât timp cât expresia din test întoarce o valoare diferită de nil. 
Apel: 


(my-while (not running-engine) 
(look-at-engine)  \ , 
(or (ask-advice) 

(think) ) 
(try-to-fix-the-moton) 
(turn-on-the-key) ) 


(defmacro while (test &rest bod 


Scriem apoi expansiunea dorită sub apel si unim prin \inii argumentele din corpul de 
apel cu poziţia lor din expansiune, dar unde secvența din expansiune ce va 
corespunde unicului parametru din apel este grupată, ca aici: 
(do () 
((not (not running-engine)) ) 
(look-at-engine) 
(or (ask-advice) 
(think) ) 
(try-to-fix-the-motor) 
(turn-on-the-key) ) 
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În corpul definiţiei, apoi, parametrul «rest (sau &body) va fi prefixat cu 
virgula-at: 


(defmacro my-while (test &body body) 
"(do () 
((not „test)) 
, @body) ) 


2.6.4 Cum se testeaza macro-expandarile? 


Funcția macroexpand-1 arată primul nivel al expandarii. Funcţia 
macroexpand arata toate nivelurile unei expandari. 


(> x 10) (princ z) y) 
(princ x) 
(princ y)) 


> (macroexpand-1 '(do ((w 3) 
(x 1 (1+ x)) 
(y 2 (1+ y)) 
(Zz) ) 
((> x 10) (princ z) y) 
(princ x) 
(princ y))) 
(BLOCK NIL 
(LET ((W 3) (X 1) (Y 2) (2)) 
(TAGBODY 
: SCFNH 
WHEN # #) 
PRINC X) 
PRINC Y) 
PSETO X # Y +) 
GO #:$CFNH) 
: $CFNI) 
(PRINC Z) 
Y)) 


2.6.5 Asupra destructurizarii 


Forma destructuring-bind primeşte un şablon, un argument ce se 
evalueaza la o lista si un corp de expresii si evalueaza expresiile cu parametrii din 
şablon legaţi la elementele corespunzătoare din lista: 


> (destructuring-bind (x (y) . z) '(a (b) c d) 
(list x y z)) 
(A B (C D)) 
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Destructurizarea e posibila, de asemenea, in listele parametrilor macro-urilor. 
Intr-o definitie de macro, defmacro, se permite ca listele de parametri sa fie 
structuri de liste arbitrare. Cand un macro de acest fel e expandat, componentele 
apelului vor fi asignate parametrilor ca printr-un dest ructuring-bind: 


> (defmacro our-dolist ((var list optional result) &body body) 


` (progn 
(mapc #' (lambda (,var) ,@body) 
, list) 
(let ((,var nil) ) 
„result))) 
OUR-DOLIST 
> (our-dolist (x '(a b c)) (print x)) 
A 
B 
C 
NIL 
> (our-dolist (x '(a b c) 'bravo) (print x)) 
A 
B 
Cc 
BRAVO 


2.6.6 Cand sa folosim macro-uri? 

Exista bucati de cod care pot fi scrise atat ca macro-uri cat si ca functii. De 
exemplu: 

(defun 1+ (x) (+ 1 x)) 


(defmacro 1+ (x) "(+ 1 ,x)) 
Un while insa nu poate fi scris decat ca un macro: 


(defmacro while (test &body body) 
"(do () 

((not ,test) ) 

, @body) ) 


pentru că el integrează expresiile pe care le primeşte ca body în corpul unui do 
unde ele vor fi evaluate numai daca test întoarce true. Printr-un macro se pot 
controla evaluările argumentelor din apel. Orice operator care trebuie sa 
acceseze parametrii înainte ca aceştia să fie evaluati trebuie scris ca macro. 


2.6.7 Argumente pro şi contra utilizării macro-urilor 


Evaluarea la momentul compilării: 


(defun avg (&rest args) 
(/ (apply #’+ args) (length args))) 


(defmacro avg (&rest args) 
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`(/ (+ ,@args) „(length args) )) 


In prima definiţie (length args) este evaluată la momentul rulării pe când în cea 
de a doua — la momentul compilării: 


> (macroexpand-1 '(avg 1 3 4 6)) 
(/ (+ 13 4 6) 4) 
T 


2.7 Un exemplu de program care se modifica in timpul rularii 


Mai jos, simbolului animal îi este atribuită o expresie care, daca este lansată 
în evaluare, inițiază un dialog ce duce la recunoaşterea unui animal. Atunci cand 
recunoaşterea este eronată, programul cere interlocutorului informaţii pentru 
rafinarea dialogului. Secvența noua de dialog astfel generată este inserată în 
program, astfel încât, la o evaluare ulterioară, arborele de decizie al programului 
este mai bogat. In acest fel, prin rulări repetate, cunoaşterea programului asupra 
diferitelor animale se perfectioneaza. 


(setq animal 


"(let ((int) (aniF) ) 
(print "Animalul are sange cald? ") 
setq ras (if (read) (print "caine") (print "lacusta"))) 


( 
(print "ok? ") 
(if (not (read) ) 
(progn 
(my-print (list "Puneti o intrebare la care " ras " sa fie raspunsul 
pozitiv: ")) 
(setq int (read-line) ) 
(print "Animalul pentru NIL: ") (setq aniF (string (read) )) 
(modify animal (list 'print ras) 
(list 'progn 
(list ‘print int) 
(list 'if (list 'read) (list 'print ras) (list 'print aniF))) 


)) 
)) 


(defun modify(str old new) 
(cond ((or (atom str) (null str)) nil) 
((equal (car str) old) (rplaca str new) T) 
((modify (car str) old new) t) 
(t (modify (cdr str) old new)))) 


(defun my-print (1) 
(cond ((null 1) (terpri)) 
(t (princ (car 1)) (my-print (cdr 1))))) 


Ceea ce urmează este un dialog în care utilizatorul are in minte animalul şopârlă: 


> (eval animal) 

"Animalul are sange cald? "nil 
"lacusta" 

"ok? "nil 
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Puneti o intrebare la care lacusta sa fie raspunsul pozitiv: Animalul 
zboara? 

"Animalul pentru NIL: "soparla 

HE 

> (eval animal) 

"Animalul are sange cald? "nil 

"Animalul zboara?"nil 


"SOPARLA" 
"ok? Niz 
NIL 


Cerințe pentru studenți 
e Sa fie capabili să implementeze algoritmi în LISP prin funcții şi macro-uri. 
e Să poată citi o expresie LISP. 


Probleme 


P2.1 a). Să se scrie o funcție LISP care să creeze structura din Figura 2.13a. 
b). Să se scrie o funcție care modifică această structură în cea din Figura 2.13b. 


c). Ce va întoarce (eq (car (cdr (caddr X))) (car (cdddr X)))? 
X a, X 
Y Z W 
Y 
a. b. 


Figura 2.13: a. Structura inițială. b. Structura transformată 


P2.2 a). Să se construiască structură de celule cons din Figura 2.14a. 
b). Să se modifice apoi la forma din Figura 2.14b. 
c). La ce se evaluează (eq (car x) (cadr x)) 

- în primul caz; 

- şi în cel de al doilea caz. 
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ae 
| beta 


Figura 2.14: a. Structura inițială. b. Structura transformată 


P2.3 Să se explice ce întoarce următorul program Lisp: 


(defun boo (foo) 
(cond ((null foo) 0) 
(t (+ 1 (boo (cdr foo)))))) 


(boo ‘(alpha beta gamma) ) 


P2.4 Să se transforme următoarea funcţie recursivă într-una iterativa: 


(defun boo-iter (foo) 
(let ((temp 0) ) 
(while foo 
(setq temp (+ 1 temp) 
foo (cdr foo))))) 


P2.5 Fie Xo mulțime de elemente ordonate crescător, X=(X;, X2... Xn), reprezentând puncte 
pe o axă, şi fie f(x) o funcţie. Scrieţi diverse variante de funcţii LISP care să calculeze 
mulțimea Y=(f(x1), î(x2) ... f(xn)). 
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Capitolul 3 
Căutare. 
Rezolvarea problemelor. 
Sisteme de producție. 


Diametrul interior al unei țevi nu trebuie să-l depăşească pe cel exterior, 
altfel gaura va fi pe dinafară. 


Michael Stillwell 


3.1 Formalizarea problemelor de IA 


In acest capitol vom vedea cum pot fi formalizate, in vederea rezolvarii, 
problemele specifice domeniului IA. In multe privinte formalizarea unei probleme de 
IA este diferită de cea a unei probleme de alta natura. Deşi reguli generale sunt 
dificil de formulat, pentru ca varietatea acestor probleme este extrem de mare, vom 
enunta cateva precepte care pot ghida acest proces. 


3.1.1 Problema, instanta de problema, spatiul starilor 


De foarte multe ori, cand vorbim de o solutie in domeniul IA ne intereseaza 
pasii in rezolvarea unei probleme, mai mult decat niste date care sa fie obtinute in 
iesire ca rezultat al unor procese de calcul aplicate unor date prezentate in intrare. 
Sa luam ca exemplu jocul de sah. O pozitie de pe tabla reprezinta complet starea 
jocului într-un anumit moment. Evoluţia jocului poate fi privită ca o secvenţă de 
tranzitii dintr-o stare în alta, plecând de la o stare inițială şi ajungând până într-o 
stare finală. Există o stare iniţială descrisă de o poziţie standard, întotdeauna 
aceeaşi în orice joc de şah. Nu există o anume stare finală, dar poate fi considerată 
stare finală orice configuraţie a tablei în care un rege se află într-o poziție atacată şi 
nu poate ieşi din acea poziţie prin nici o mutare legală. Intre aceste două stări există 
un număr finit, dar extrem de mare, de posibilități de a ajunge prin mutări legale. 
Numărul total de poziţii ale jocului de şah formează ceea ce se numeşte spatiul 
stărilor. 

Vom exemplifica formalizarea problemelor de IA pe câteva exemple de 
probleme considerate clasice în domeniu. Astfel de probleme, datorită dimensiunii 
lor mici, sunt cunoscute sub numele de probleme jucărie (toy problems). In multe 
cazuri studiul lor ajută la identificarea metodologiei de rezolvare a problemelor de 
dimensiune reală. In alte cazuri însă diferența de dimensiune între problemele 
jucărie şi cele reale este atât de mare încât soluţiile probate pe primele nu pot fi 
aplicate pe cele din urmă. Şi într-un caz şi în celălalt, studiul problemelor jucărie 
constituie un antrenament util pentru dezvoltarea abilităţilor de a lucra cu concepte 
ale domeniului IA. 
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Problema 8-puzzle: Există o tabla 3x3 pe care se găsesc si se pot muta 8 piese 
pătrate. La un moment dat, o singură piesă poate fi miscataé cu o poziţie, pe 
orizontală sau verticală, în limitele cadrului tablei, în singurul loc liber. Plecând de la 
o configuraţie inițială a tablei trebuie să se ajungă într-alta, ce este de asemenea 
data. 


Problema misionarilor si canibalilor: 3 misionari şi 3 canibali se află la marginea 
unui râu şi doresc să treacă pe celălalt mal. Ei au la dispoziție o barcă de două 
persoane. Dacă la un moment dat, pe un mal sau pe celălalt numărul canibalilor 
întrece pe cel al misionarilor, misionarii sunt în pericol de a fi mâncaţi de canibali. 
Problema constă în a afla cum pot trece râul cele 6 persoane în deplină siguranță. 


Problema generării frazelor în limbaj natural: Se dispune de un lexic (prin care 
fiecărui cuvânt i se ataşează o parte de vorbire) şi de o gramatică (care este o 
colecție de reguli, fiecare spunând cum poate fi expandat o categorie compusă în 
subcompuşi). Se doreşte generarea unei exprimări corecte gramatical. 


Prima preocupare într-o problemă de IA este de a 
recunoaşte în problema generală instanţele acesteia 


Nu poate fi considerat jucător de şah un personaj capabil să rezolve doar o 
anume situație de pe tabla se joc, ci cel capabil să abordeze orice situaţie. Analog, 
nu poate fi considerat conducător auto o persoană capabilă să mişte maşina numai 
de acasă până la serviciu. Ca să merite acest titlul, teoretic cel puţin, acea persoană 
trebuie să poată conduce maşina din orice punct în orice alt punct. Aceste exemple 
vor să pună în evidenţă diferenţa dintre probleme şi instanțe ale lor. Jocul de şah 
defineşte o problemă. Conducerea maşinii — o alta. 

In cazul jocului de şah, de obicei se precizează o poziţie iniţială şi o indicație 
asupra terminării (de exemplu, care jucător trebuie să câştige, eventual şi în câte 
mutări). In cazul conducerii maşinii, se precizează unde se află maşina, unde trebuie 
ea adusă şi se cunoaşte o hartă pe care sunt marcate drumurile pe care poate ea 
circula. Astfel de descrieri definesc instanțe de problemă. 

In problema 8-puzzle o instanţă este dată de o anumită pereche formată din 
configurația inițială şi finală a tablei. 

In problema misionarilor şi canibalilor, aşa cum este ea formulată, nu există 
decât o unică instanță. Dar ea suportă un enunţ general care să admită şi alte 
instanțe de problemă, spre exemplu cazul a n canibali şi a n misionari. O instanţă 
poate fi atunci problema în care apar 3 canibali + 3 misionari, alta cea în care apar 4 
canibali + 4 misionari etc. 
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În problema generării limbajului o instanţă de problemă este dată de o 
gramatică. Astfel, de exemplu, am putea avea gramatica Ga = (Ni, Ti, Si, Pi}, 
în care: 


Ni = {PROP, GN, GV, S, V} — o mulţime de simboluri neterminale cu 
semnificaţiile: propoziţie, grup nominal, grup verbal, substantiv şi verb; 

Tı = (pisica, şoarecele, prinde) — o mulţime de cuvinte; 

Sı = {PROP} -— un simbol de start al gramaticii, alegerea lui semnificând că ceea ce 
se doreşte să se obțină reprezintă propoziţii ale acestui mini-limbaj; 


Pı = {PROP := GN GV, 

GN := S, 

GV := V GN, 

S := pisica, 

S := soarecele, 

V := prinde) — o mulţime de reguli de producţie, cu semnificația 
evidentă. 


O instanţă de problema, în acest caz, ar cere obținerea unei propoziţii oarecare in 
limbajul descris de această gramatică. 

Toate instanțele aceleiaşi probleme au ceva în comun: maniera de rezolvare. 
Acelaşi algoritm ar trebui să lucreze pentru orice instanță a unui probleme date. 
Având o soluție pentru cazul general, rezolvarea unei anumite instanțe reprezintă 
doar o chestiune de alimentare a programului cu alte date de intrare. Din acest 
punct de vedere o problemă de IA nu se deosebeşte cu nimic de o problemă clasică. 


3.1.2 Recunoaşterea stărilor 


O stare reprezintă a configurație anumită a entităților care populează 
universul problemei în drumul spre soluție. Nu este însă întotdeauna elementar să 
se decidă care dintre momentele intermediare ale drumului spre soluție trebuie 
considerată stare şi care nu. Dacă am imagina un film care redă drumul spre soluție, 
întrebarea la care trebuie să răspundem este ce cadre reprezintă imagini de stări si 
care nu. De asemenea, este foarte util să putem aprecia cât de mare este spatiul 
stărilor. 


A doua preocupare într-o problemă de IA este de a recunoaşte 
o stare şi de a aprecia dimensiunea spațiului stărilor 


În cazul jocului 8-puzzle recunoaştem imediat că o stare trebuie să reprezinte 
o configuraţie anumită a tablei la un moment dat. Ar fi greu de imaginat de ce o 
alegere a stării ca, de exemplu, aceea în care piesa mobilă să fie într-o poziţie 
intermediară între un cadru şi următorul, ar avea vreo semnificație anumită în 
rezolvarea problemei. Dimensiunea problemei este dată de numărul stărilor teoretic 
posibile în rezolvarea problemei. La 8-puzzle numărul acestora este 9!=362.880 
pentru că avem 9 posibilități de a aşeza o piesă pe tabla goală, pentru fiecare poziţie 
a acesteia — avem 8 posibilităţi de a o aşeza pe a doua, ş.a.m.d. 

In problema canibalilor şi misionarilor o stare este o ipostază anumită în 
traversarea râului. Filmul, prin însuşi esenţa lui de naraţiune vizuală, abundă în 
detalii. Oare ce cadre ale filmului care ar nara vizual traversarea care convine ca 
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rezolvare a problemei pot fi luate ca reprezentative pentru a descrie stari? Cea mai 
adecvata ipostaza de stare aici este o situatie in care barca se afla pe unul din 
maluri şi in care avem un număr de misionari şi unul de canibali pe malul cu barca în 
timp ce restul lor se află pe celălalt mal. Nu avem nici un motiv să credem că o 
poziție intermediară, de exemplu aceea in care barca s-ar afla la mijlocul râului în 
cursul unei traversări, ar putea să ne intereseze. Considerarea acestor cadre 
intermediare drept stări ar mări nejustificat spaţiul stărilor. Ca să înțelegem de ce 
este inutilă considerarea unei poziţii intermediare în traversarea râului, drept stare, 
să observăm că din poziția în care barca se află pe unul din maluri, cu un număr 
anumit de misionari şi canibali pe fiecare mal, şi până în situaţia în care barca este 
pe malul opus, cu o altă combinaţie de misionari şi canibali pe ambele maluri, am 
putea să deducem — modulo un număr de detalii fără importanţă — toate poziţiile 
intermediare în care barca s-ar fi aflat între un mal şi celălalt. Considerarea drept 
stare a oricărei poziţii intermediare nu aduce deci nici un spor de informatie fata de 
cazul în care am ignora-o. 

Prin aceasta deducem că spaţiul stărilor problemei misionarilor şi canibalilor 
este dat de numărul posibil de combinaţii c+m+b (cu c — numărul de canibali, m — 
numărul de misionari, b — existenţa ori nu a bărcii) pe cele două maluri, fiecare în 
parte respectând restrictia, să-i zicem de "ne-ingerare": 


b - ccct+mmm (invalidă: barca e pe malul pe care nu se află nici un călător) 


m+b - ccc+mm (invalidă: situație periculoasă pe malul drept) 
mm+b - ccc+m (invalidă: situaţie periculoasă pe malul drept) 
mmm+b — ccc 

ctb — cc+mmm 

ct+tmt+b cctmm 

c+mm+b - cc+m (invalida: situație periculoasă pe malul drept) 
c+mmm+b cc 

cctb — c+mmm 


ce+m+b - c+mm (invalida: situație periculoasă pe malul stâng) 
ce+mm+b = c+m 

cctmmmtb - c 

ccc+b — mmm 

ccc+m+b - mm (invalida: situație periculoasă pe malul stâng) 
ccc+mm+b - m (invalida: situație periculoasă pe malul stâng) 
ccc+mmm+b - 


adică 9 stări valide cu barca pe malul stâng, la care se adaugă tot atâtea cazuri în 
care barca se află pe malul drept, deci un total de 18 stări. 

In problema generării frazelor, o stare poate fi o configurație de simboluri 
terminale şi neterminale, la un anumit moment dat în derivare. Spaţiul stărilor este 
corelat cu dimensiunea limbajului generat de gramatică, mai mare decât acesta, 
posibil infinită dacă gramatica este recursivă. In cazul particular al gramaticii date 
mai sus în această secțiune, spatiul total cuprinde aproximativ 37 de stări. 

Comparând spațiile acestor probleme cu cel al stărilor jocului de şah, care se 
ştie că este de ordinul a 10'2 putem înțelege de ce jocul de şah este mult mai greu 
de rezolvat decât oricare dintre problemele noastre jucărie. 
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3.1.3 Reprezentarea starilor 


In problema 8-puzzle, o stare poate fi reprezentată de o matrice 3x3 în care 
elementele sunt numere cuprinse între O (reprezentând spaţiul) şi 9. O alta 
posibilitate ar fi să reprezentăm tabla ca trei vectori, fiecare cu câte trei poziții. 
Alegerea uneia sau a alteia dintre posibilităţi depinde de uşurinţa cu care se descriu 
condițiile asupra tablei şi acţiunile capabile să transforme o stare în alta, după cum 
vom vedea mai departe. 

Să observăm că în problema canibalilor şi misionarilor este suficient să ţinem 
minte situaţia de pe un mal şi poziţia bărcii, pentru că situaţia de pe celălalt mal se 
obţine prin diferenţă. Deci o reprezentare adecvată poate fi aici un vector format din 
doi întregi (fiecare având valori cuprinse între O şi 3) ce dau numărul canibalilor, 
respectiv al misionarilor, de pe malul stâng, şi o variabilă logică care defineşte 
existenţa ori nu a bărcii pe malul stâng: (c, m, b). 

În problema generării limbajului, cum o posibilă stare este o combinaţie de 
simboluri terminale şi neterminale, reprezentarea unei stări poate fi un şir (listă) de 
simboluri. Astfel, o derivare posibilă plecând de la gramatica aleasă ca exemplu 
este: PROP > GN GV > S GV > pisica GV > pisica V GN > pisica prinde GN > 
pisica prinde S > pisica prinde pisica. Stările atinse în această rezolvare au fost în 
ordine: (PROP), (GN GV), (S GV), (pisica GV), (pisica V GN), (pisica prinde GN), 
(pisica prinde S), (pisica prinde pisica). 


A treia preocupare într-o problemă de IA este găsirea 
celei mai adecvate reprezentări a stărilor 


3.1.4 Reprezentarea tranzitiilor între stări 


O soluţie într-o problemă de IA înseamnă găsirea unei căi între o stare inițială 
şi o stare finală. Putem să ne imaginăm un proces de rezolvare în două moduri: o 
manieră în care stările există deja, iar rezolvarea presupune o tranzitare, de către un 
automat, a acestui spaţiu al lor deja generat şi o alta în care stările se creează doar 
în momentul atingerii lor, ele neexistând anterior. In primul caz o mişcare legală 
provoacă părăsirea unei stări şi trecerea în alta, în timp ce în al doilea caz o mişcare 
legală provoacă generarea unei noi stări plecând de la una dată. Deosebirea este de 
natură implementationala si are, evident, o mare importanţă în eficiența procesului 
de rezoluţie însă nu influențează maniera generală de rezolvare a problemei. 


A patra preocupare în descrierea unei probleme de IA este 
reprezentarea tranzitiilor posibile între stări (reguli) 


“mA 


Pentru efectuarea acestei "deplasări" în spaţiul stărilor trebuie definit un set 
de operatori, sau reguli de producţie, sau simplu reguli, care precizează mişcările 
legale. Se întâmplă adesea ca aceleaşi tipuri de tranzitii să poată fi aplicate între 
perechi de stări diferite. Spre exemplu, în Figura 3.1 sunt sugerate prin săgeți de 
forme diferite patru tipuri de tranzitii. 
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Figura 3.1: Tranzitiile între stări pot fi clasificate după tipuri 


Dacă este posibilă clasificarea tranziţiilor pe tipuri, atunci este probabil ca 
aceleaşi tranzitii să se aplice atunci când stările de plecare au ceva în comun, cu 
alte cuvinte îndeplinesc nişte condiţii similare. 

Există mai multe modalități de a preciza tranzitiile legale dintr-o stare în alta. 
Una este de a le descrie "cu cărţile foarte aproape de ochi", cu alte cuvinte într-o 
manieră care să ia în considerare detalii legate anumite instante de problemă. In 
general obținem astfel un număr mare de reguli. O descriere satisfăcătoare trebuie 
să se preocupe să fie suficient de generală pentru a o putea utiliza în cât mai multe 
instanţe date de problemă. 

De exemplu, o mişcare uzuală de deschidere la un joc de şah este avansarea 
pionului cu două poziţii. Această mişcare a pionului nu este însă permisă decât 
atunci când pionul se află în poziţia lui iniţială, în orice alt moment al jocului pionul 
putând avansa doar cu o poziție. Am avea aşadar o serie de reguli de forma: 


regula mute+-pion-din-a 


DAC e 
pion in pozi-ria (a,2) «i 
pozieia (a,3) e libere «i 
pozieia (a,4) e libere 
ATUNCI 
mute pionul din pozi-ria (a,2) în pozicia (a,4). 


Vom avea un număr de 8 reguli de acest fel, câte una pentru fiecare pion. O 
reprezentare mai economică ar utiliza o singură regulă capabilă să exprime poziția 
oricărui pion aflat pe al doilea rând care avansează pe rândul patru. 
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regula mute-pion (x) 
DAC» 
pion in pozieia (x,2) œi 
pozieia (x,3) e libere ei 
pozieia (x,4) e libere 
ATUNCI 
mute pionul din pozieia (x,2) în pozieia (x,4). 


În general o regulă este de forma: 


<nume regulă> 
DACĂ <conditii> ATUNCI <actiuni> 


Activitatea pe care o poate desfăşura o regulă poate fi exprimată astfel: daca 
partea de condiţii este satisfăcută de starea curentă, atunci se realizează acţiunile. 
Uneori, partea de acţiuni înseamnă generarea unei noi stări, alteori doar tranzitarea 
într-o stare care era anterior generată. 

Din cele de mai sus rezultă că preocuparea a patra constă în inventarierea 
tuturor tranzițiilor posibile între stări şi descrierea acestor tranzitii ca reguli formate 
din condiţii şi acţiuni. Un set de reguli este specific unei probleme iar nu unei 
instanţe de problemă. Cu alte cuvinte, acelaşi set de reguli trebuie să poată fi aplicat 
pentru rezolvarea oricărei instanţe a unei probleme date. 

In 8-puzzle, reguli posibile ar putea fi: mută-1-sus, mută-1-jos, muta-1- 
dreapta, mută-1-stânga, mută-2-sus, ş.a.m.d., fiecare dintre ele conditionand, 
bineînțeles, executarea mişcării de existența unei poziţii în direcția respectivă 
cuprinsă în cadrul tablei. Am avea astfel câte patru reguli pentru fiecare număr 
(placuta), adică 32 de reguli. Un salt calitativ în reprezentarea regulilor îl obținem 
însă dacă în loc să ne intereseze mutarea unei piese ne-am concentra asupra 
mutării blancului. Putem astfel să restrangem numărul de reguli la 4: muta-blanc- 
sus, mută-blanc-jos, mută-blanc-dreapta, mută-blanc-stânga. 


Regula mute-blanc-sus 


DAC e 
blancul nu e lipit de marginea de sus a tablei 

ATUNCI 
schimb. pozi-ia blancului cu a cesucei aflate deasupra 
acestuia 


În problema generării frazelor, o regulă ar trebui să mimeze destul de 
aproape o regulă de producţie a gramaticii, pentru că, între o stare şi următoarea, un 
simbol aflat în partea stângă a unei reguli dispare, locul lui fiind luat de simbolurile 
aflate în partea dreaptă a regulii. Ca urmare vom avea tot atâtea reguli ale 
sistemului de IA câte reguli de producţie are gramatica. 


3.1.5 Căutarea soluţiei 


Am discutat până acum despre spațiul stărilor unei probleme si am învăţat 
să alegem o reprezentare pentru stări. Ştim că tranzitiile între stări sunt descrise de 
un set de operatori pe care le-am numit reguli de producţie şi am văzut că a 
rezolva o problemă înseamnă a găsi un drum între o stare inițială şi una sau mai 
multe stări finale ce sunt cunoscute precis ori numai descrise printr-un set de 
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restricţii. Maniera în care organizăm căutarea în spațiul stărilor, deci modul în care 
tnlantuim operatorii pentru găsirea soluţiei constituie următoarea preocupare. 
Problemele de IA se aseamănă prin aceea că în toate rezolvarea presupune 
nu găsirea unei anume stări, ci găsirea unui drum care să unească o stare iniţială de 
una finală. Atunci când starea finală nu este precizată cu exactitate, găsirea unui 
drum către o stare, care este recunoscută ca fiind finală prin satisfacerea unor 
constrângeri specifice, coincide, totodată, cu darea unui răspuns aşteptat. 


stare fundătură stare finală posibilă 


tranziție 


stare inițială 


dimensiunea spatiului stărilor 


Figura 3.2: Rezolvarea unei probleme de IA prin navigare în spațiul stărilor 


Acest lucru face ca o problemă de IA să fie una de căutare într-un spatiu al 
stărilor Din cauză că, adesea, spaţiul stărilor este foarte mare se utilizează diferite 
strategii pentru a eficientiza căutarea. Există mai multe tipuri de strategii, dar ele 
sunt clasificate în două clase mari: irevocabile şi tentative. Aplicarea unei strategii 
este necesară pentru a decide calea de urmat în situaţiile în care dintr-o stare 
anumită există mai multe căi de a tranzita într-o altă stare, ca urmare mai mult decât 
o singură regulă este posibil de a fi aplicată. 


Alegerea unei strategii reprezintă cea de a 5-a preocupare 
în rezolvarea unei probleme de IA 
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3.2 Exemple de formalizari 


Vom continua exemplificarea primelor patru precepte pentru rezolvarea unei 
probleme de IA, prezentate în secțiunea precedentă, cu încă două probleme, de 
asemenea bine-cunoscute. 


3.2.1 Maimuta şi banana 


O maimuţă este închisă într-o cuşcă în care se mai află o banană atârnată de 
tavan la o înălțime la care maimuta nu poate ajunge şi, într-un colt, o cutie. După un 
număr de încercări nereuşite de a apuca banana, maimuța merge la cutie, o 
deplasează sub banană, se urcă pe cutie şi apucă banana. Se cere să se 
formalizeze maniera de raţionament a maimutii ca un sistem de reguli de producție. 


Cerinta |. Problemă — instanţă de problema 


Distinctia dintre problema si instanta a ei este nesemnificativa in acest caz. 
Sunt posibile slabe variatii ale enuntului in care de exemplu se precizeaza pozitiile 
initiale relative ale obiectelor din cusca etc. 


Cerinta a Il-a. Aprecierea a ce reprezintă o stare şi a spaţiului stărilor 


Dacă ar fi să eliminăm dintr-un film care ar derula acţiunile maimutii între 
situaţia în care ea se află într-un colt, cutia într-alt colt şi banana e legată de tavan şi 
situația in care maimuța e urcată pe cutie, la verticala babanei şi tine în mână 
banana, acele secvenţe pe care nu le considerăm importante pentru a rămâne 
numai cu cadrele semnificative, am rămâne probabil cu următoarea secvenţă de 
“benzi desenate”: 


Figura 3.3: O secvenţă de stări care rezolvă problema maimutii şi a bananei 
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În afara acestor stări, care sunt evidente şi absolut necesare in derularea 
filmului, dacă am investiga alte posibile ipostaze ale maimutii în tentativa ei de a 
ajunge la banană, am găsi, probabil, printre altele, şi pe acestea: 


d d d 


| 6 


Figura 3.4: Stări posibile dar neinteresante 


Mulțimea tuturor acestor stări, fie că sunt ori nu pe drumul spre soluţie, 
formează mulțimea stărilor problemei. Simplitatea acestei probleme ne-ar putea 
determina să lăsăm la o parte acele stări care nu pot face parte dintr-o eventuală 
cale spre soluţie. Acesta este unul din pericolele care pot face o soluţie 
inacceptabilă. Nu trebuie să uităm că ceea ce facem noi este formalizarea unei 
probleme ce trebuie rezolvată de “cineva” care nu cunoaşte soluția sau cel putin, nu 
o cunoaşte în maniera în care o cunoaştem noi. Un inventar atent al tuturor situaţiilor 
în care ar putea să ajungă un automat ce se mişcă în spaţiul dat trebuie întotdeauna 
făcut. Să nu amestecăm cunoaşterea noastră, ca ființe raţionale, cu cea a maşinii 
care nu “ştie” nimic în momentul în care începe să “descopere” soluția. 


Cerinta a Ill-a. Reprezentarea stărilor 


În reprezentarea stărilor va trebui să ne gândim care sunt aspectele care 
contează în scenele pe care le-am decelat ca semnificative pentru a reprezenta 
stări. Uneori ceea ce contează sunt relaţiile dintre obiectele ori personajele conţinute 
în scene. Este ceea ce se întâmplă în problema noastră: aici ne interesează relaţiile 
reciproce care există între maimuţă, cutie şi banană. Astfel 


= maimuța fata de cutie se poate afla: “la distanță”, “lângă”, “pe” sau “sub”; 
= cutia fata de banană se poate afla: “lateral” sau “sub”; 


= maimuţă fata de banană se poate afla: “la distanţă” (adică la o distanţă de unde 
nu o poate apuca), “aproape” (adică la o distanţă de unde o poate apuca) sau 
“tinand-o”. 
Desigur ca daca avem codificare aceste relatii, cele simetrice lor (respectiv 
dintre cutie şi maimuţă, banana şi cutie şi banană şi maimuţă), pot fi inferate imediat 
şi deci nu mai trebuie codificate. 
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Urmatoarele predicate devin astfel cele de care avem nevoie. 
Relatia Maimuta — Cutie: 


MC-departe = Maimuta se afla departe de Cutie 
MC-lângă = Maimuta se află lângă Cutie 

MC-pe = Maimuta se afla pe Cutie 

MC-sub = Maimuta de află sub Cutie 


Relaţia Cutie — Banană: 


CB-lateral = Cutia este aşezată lateral fata de Banana 
CB-sub = Cutia este aşezată sub Banană 


Relaţia Maimuta — Banana: 


MB-departe = Maimuta se află departe de Banana 
MB-aproape = Maimuta se află aproape de Banana 
MB-tine = Maimuta tine Banana 

Cu aceste predicate, descrierea starilor problemei devine: 


Starea iniţială: MC-departe, CB-lateral, MB-departe 
Starea finală: MC-pe, CB-sub, MB-tine. 


Cerinta a IV-a. Reprezentarea regulilor 


Regulile reprezintă descrierea tranziţiilor între stări. Când proiectăm regulile, 
ca şi în cazul reprezentării stărilor, ne punem problema să descriem toate tranzitiile 
posibile, chiar şi cele care noua, cu mintea noastră de fiinte umane, ni se par 
absurde, ca de exemplu, urcarea maimutei pe cutie într-un punct ce nu se află pe 
verticala bananei, împingerea ei până într-un punct ce nu se află pe verticala 
bananei, urcarea cutiei deasupra capului ori coborârea maimutei de pe cutia aflată la 
verticala bananei fără banană. Trebuie să ne plasăm în postura maşinii care nu ştie 
soluția, ci trebuie s-o găsească singură. Ca urmare trebuie să-i îngăduim toate 
mişcările posibile în acest univers pe care l-am descris, urmând ca ea singură să 
evite acele mişcări ce sunt absurde sau inutile. 


Următoarele tranzitii pot fi inventariate: 
e aflată departe de cutie, maimuta de aproprie de cutie: apropie-MC; 
e aflată lângă cutie, maimuța se depărtează de cutie: depărtează-MC; 
e aflată lângă cutie, maimuţă trage cutia sub banana: trage-sub-MCB; 


e aflată lângă cutie şi sub banană, maimuţă trage cutia de sub banană: trage- 
lateral-MCB; 


e aflată lângă cutie, maimuţă se urcă pe ea: urcă-MC; 
e aflată pe cutie, maimuța coboară de pe ea: coboară-MC; 


e aflată pe cutie, maimuța se ridică pentru a se apropia de banana: apropie-MCB; 
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e aflată pe cutie si ridicată pentru a apuca banana, maimuța se ghemuieste, 
departandu-se de banană: depărtează-MCB; 
e aflată lângă cutie, maimuta îşi urcă cutia deasupra capului: urcă-pe-cap-MC; 


e din postura în care maimuţă tine cutia deasupra capului, maimuta îşi dă jos cutia 
de pe cap: coboară-de-pe-cap-MC; 


e aflată aproape de banană, maimuța apucă banana: apucă-MB. 


Vom conveni să exprimăm regulile prin forma generală: 


dacă <conditii> atunci <actiuni> 


starea de plecare starea de sosire 


Figura 3.5: O regulă 


În partea de condiții caracterizăm minimum de cunoştinţe necesare pentru a 
descrie starea în care dorim să se aplice regula. Trebuie să ne imaginăm o regulă 
ca şi când n-ar fi aplicată de noi ci s-ar aplica singură atunci când găseşte condiţii 
favorabile, adică când starea curentă a sistemului satisface condiţiile ei. Partea de 
condiţii nu conţine nicidecum o descriere exhaustivă a stării, ci numai a unei parti a 
ei, ceea ce este semnificativ pentru depistarea stării. De exemplu, dacă dorim ca o 
regulă să se aplice numai când maimuta se află lângă cutie, în partea de condiţii a 
regulii vom include numai predicatul MC-1lângă, deşi starea respectivă, de exemplu 
starea a doua din secvenţa de mai sus, mai are în descrierea ei şi predicatele MB- 
departe şi CB-lateral. 


Odată găsită starea în care se verifică condiţiile regulii, regula se aplică, ceea 
ce are ca rezultat efectuarea anumitor schimbări în stare. Schimbările din stare sunt 
descrise în partea ei de acţiuni. Din nou, partea de acţiuni a regulii nu descrie în 
întregime starea de sosire ci numai schimbările care se produc în stare pentru a o 
face diferită de starea de plecare. Să mai observăm că starea de plecare din Figura 
5 nu trebuie confundată cu starea iniţială din formularea problemei, după cum starea 
de sosire e altceva decât starea finală. Orice pereche de două stări, între care poate 
avea loc o tranziţie, cuprinde o stare de plecare, respectiv una de sosire. 
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lată exprimarile câtorva reguli: 


apropie-MC: 
dacă {MC-departe} atunci ŞTERGE (MC-departe), ADAUGĂ (MC-lângă) 


depărtează-MC: 
dacă (MC-lângă) atunci ŞTERGE 


na 


MC-lângă), ADAUGĂ (MC-departe) 


trage-sub-MCB: 
daca (MC-lângă, CB-lateral} atunci ŞTERGE {CB-lateral}, 
ADAUGA{CB-sub} 


trage-lateral-MCB: 
dacă (MC-lângă, CB-sub) atunci ŞTERGE (CB-sub), ADAUGĂ (CB- 
lateral) 


urca-MC: 
dacă (MC-lângă) atunci ŞTERGE (MC-lângă), ADAUGA{MC-pe} 


coboara-MC: 
dacă (MC-pe) atunci ŞTERGE {MC-pe}, ADAUGĂ (MC-lângă) 


apropie-MCB: 
dacă {MC-pe, MB-distanta, CB-sub) atunci ŞTERGE {MB-distanta}, 
ADAUGĂ (MB-aproape) 


urcă-pe-cap-MC: 
dacă (MC-lângă) atunci ŞTERGE (MC-lângă), ADAUGĂ (MC-sub) 


apucă-MB: 
dacă (MB-aproape) atunci ŞTERGE {MB-aproape}, ADAUGĂ (MB-ţine) 


3.2.2 Lumea cuburilor (blocurilor) 


Se consideră o stivă de cuburi, ca cea din Figura 6a. Un braţ de robot poate 
efectua următoarele mişcări: prinde un cub aflat deasupra unei stive sau deplasează 
un cub aflat în mână pentru a-l aşeza fie pe masă, fie pe un alt cub care e liber 
deasupra. Se cere să se formalizeze problema controlului braţului pentru a aduce 
blocurile dintr-o configuraţie iniţială într-alta considerată finală, de exemplu cea din 
Figura 6b. Nu este importantă distanţa dintre stive, ci doar ordinea blocurilor în stive. 
Ca să ţinem lucrurile simple, vom considera că pentru controlul braţului, din situația 
în care acesta se află într-o anumită poziţie, este suficient să se indice poziția 
următoare a lui fără a ne preocupa de traiectorie, distanţe, accelerări ori decelerări — 
adică amănunte ce apar în mod normal în probleme de control a roboților. 


a. starea iniţială b. starea finală 


Figura 3.6: Problema cuburilor 
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Cerinta |. Problema — instanţă de problema 


Dintre toate problemele posibile de mutare a unui numar oarecare de cuburi 
dintr-o configuraţie iniţială într-una finală, problema, aşa cum a fost ea definită mai 
sus, prezintă instanţa caracterizată prin exact trei cuburi, o anumită configuraţie a lor 
ce reprezintă starea iniţială şi o anumită configuraţie ce defineşte starea finală 
(precizate în Figura 3.6). Este evident că în cadrul aceleiaşi probleme o mulțime de 
alte instanţe de probleme pot fi definite. Conturarea soluţiilor pentru toate acestea ar 
trebui însă să nu necesite eforturi suplimentare de programare celor necesare 
rezolvării instanţei de fata, de exemplu. 


Cerinta a Il-a. Aprecierea a ce reprezintă o stare şi a spațiului stărilor 


Reflectând la ce anume trebuie să fie o stare in problema de fata, vom ajunge 
inevitabil la dilema: situaţiile în care braţul tine un bloc trebuiesc considerate ca stări 
ori nu. A le ignora înseamnă a lăsa în inventarul stărilor numai poze ale stivelor, 
ignorând situaţiile intermediare în care braţul tine un bloc. Să încercăm să analizăm 
cele două posibilităţi. 


Există două situații care sunt semnificative înainte de ridicarea unui bloc: 
blocul se află pe masă sau blocul se află pe alt bloc. Aceleaşi două situaţii sunt 
semnificative după lăsarea unui bloc. Teoretic avem deci 2*2=4 combinaţii posibile 
de mişcări: de pe masă pe masă, de pe masă pe un bloc, de pe un bloc pe masă şi 
de pe un bloc pe un alt bloc. Aşadar dacă ignorăm posturile intermediare ale braţului 
ținând blocul ce se transportă, această alegere a stărilor ne va duce la scrierea a 
patru reguli. Dacă dimpotrivă luăm în considerare ca stări şi situaţiile în care blocul 
de transportat este ţinut in mana robotului, vom avea mişcările: de pe masă în brat, 
de pe bloc in brat, din brat pe masa şi din brat pe alt bloc, adică tot patru reguli. 
Rezultă că în acest caz, din punctul de vedere al numărului de reguli ce vor trebui 
elaborate, nu e importantă alegerea pe care o facem. 


Într-un caz general însă, în care numărul stărilor de plecare şi respectiv de 
destinaţie (v. Figura 5 pentru o reamintire a termenilor) ale mişcărilor ar fi m şi n, am 
avea un număr de m*n reguli cand ignoram posturile intermediare, dar numai m+n 
când nu le ignorăm. Este deci mai economic, în număr de reguli ce trebuie 
proiectate, să încercăm să facem o spargere mai fină a mişcărilor în componente 
prin considerarea unor stări intermediare, atunci când aceste componente se 
dovedesc a fi parti constitutive ale mai multor mişcări complexe. O astfel de rafinare 
nu-şi are însă rostul atunci când stările intermediare, astfel puse în evidenţă, nu se 
regăsesc în mai multe mişcări pentru că în loc de a micşora numărul total de reguli l- 
am mări inutil. 


Doar din considerentul de a adopta soluția care duce în general la o 
reprezentare mai compacta, în rezolvarea dată mai jos opțiunea va fi de a considera 
ca stări intermediare şi situaţiile în care blocuri se află în mâna robotului. Invităm 
cititorul să construiască o soluţie în care aceste stări intermediare sunt ascunse. 
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Cerinta a Ill-a. Reprezentarea stărilor 


Să privim starea iniţială (v. Figura 3.6a) şi să încercăm să decidem care sunt 


elementele esenţiale în reprezentarea ei. Aşa cum am convenit deja, ceea ce 
interesează într-o stare este ordinea blocurilor în stive (la un moment dat ar putea să 
apară mai multe) cât şi starea braţului, adică dacă e liber sau dacă dimpotrivă ţine 
un cub. Avem mai multe posibilități de a defini ordinea blocurilor într-o stivă: 


utilizând un vector de nume de blocuri şi o convenţie asupra capătului stivei: 
(A, B, C) — cu semnificaţia, de exemplu, că blocul de pe masă este A, iar cel 
liber deasupra este C. Reprezentarea aceasta (v. Figura 3.7a) este 
economică şi are avantajul că poate fi uşor modificată pentru a descrie 
situația în care există mai mult decât o singură stivă. Fiecare stivă poate fi 
definită printr-un predicat stiva. Starea iniţială devine {stiva(A, B, C)}, iar cea 
finală (stiva(C, B), stiva(A)); 

precizând prin nişte predicate, să zicem peste şi sub, vecinii pe care fiecare 
bloc îi are dedesubt şi respectiv deasupra. Cu această convenție, starea 
iniţială ar fi reprezentată prin setul de predicate: {peste(A, masa), sub(A, B), 
peste(B, A), sub(B, C), peste(C, B), sub(C, nil)}, unde masă si nil ar 
semnifica masa şi respectiv lipsa unui bloc (v. Figura 3.7b). Această soluție 
are dezavantajul unei anumite redundante în reprezentare. Intr-adevăr faptul 
că blocul B se află peste blocul A este precizat atât de predicatul sub(A, B) 
cât şi de peste(B, A); 

redundanta din notația de mai sus sugerează notarea numai a relaţiilor dintre 
blocurile vecine şi dintre acestea şi masă, precum şi a blocurilor care sunt 
libere deasupra. Cu predicatele peste şi liber, starea iniţială poate fi notată: 
(peste(A, masă), peste(B, A), peste(C, B), liber(C)}, iar cea finală: {peste(C, 
masa), peste(B, C), liber(B), peste(A, masa), liber(A)} (v. Figura 7c). 


nil 
su 
peste 
su 


stiva 


C 
= 
cI 


a. ordine definită b. ordine definită prin c. ordine definită prin 
global vecinatati locale relatii dintre obiecte 


Figura 3.7: Posibilităţi de reprezentare a aşezării relative a blocurilor 
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În toate aceste cazuri mai trebuie adăugată cunoaşterea asupra braţului. 
Două sunt stările care caracterizează braţul: braţul este gol şi braţul tine blocul X (v. 
Figura 3.8), adică predicatele: mana-libera şi respectiv mana-tine(X). 


mo 


a. mana-libera b. mana-tine(X) 


Figura 3.8: Reprezentarea configuratiilor mâinii 


Vom continua să investigăm în paralel prima şi ultima variantă. Astfel pentru 
prima variantă vom avea: 


Starea iniţială: (stiva(A, B, C), mâna-liberă) 
Starea finală: {stiva(C, B), stiva(A), mana-libera} 


iar pentru ultima variantă: 


Starea iniţială: (peste(A, masa), peste(B, A), peste(C, B), liber(C), mana-libera} 
Starea finală: (peste(C, masă), peste(B, C), liber(B), peste(A, masă), liber(A), 
mana-libera} 


Cerinta a IV-a. Reprezentarea regulilor 


Cele patru tipuri de mişcări descoperite mai sus, în convenţia în care 
reprezentăm ca stări şi situaţiile in care blocurile sunt ținute in mâna robotului, duc 
în mod direct la scrierea a patru reguli, în forma pe care am convenit-o deja în 
secțiunea 3.1.4, adică: dacă...atunci..., unde în partea dacă vom descrie condiţii 
pentru recunoaşterea stărilor de plecare ale regulii, iar în partea atunci, vom descrie 
acţiuni. Aceste acţiuni trebuie să specifice modificările de realizat în starea de 
plecare pentru ca ea să se transforme în starea de sosire. Ele vor consta din 
eliminarea unor predicate din descrierea stării de plecare şi includerea altora, deci 
vor avea forma şterge...adaugă.... 


În varianta din Figura 3.7a avem următoarele reprezentări pentru reguli (v. şi Figura 
3.9): 

ia-de-pe-bloc(X,Y): 

dacă {stiva(*, Y, X), mâna-liberă) atunci STERGE{stiva(*, Y, 
X), mâna-liberă) ADAUGA{stiva(*, Y), mana-—tine (X) } 


unde stiva(*, X, Y) semnifica o stiva a carei parte de la baza este oarecare. 
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ia-de-pe-masa(X): 
daca {stiva(X), mâna-liberă) atunci STERGE{stiva(X), mâna- 
liberă) ADAUGA{mAna-tine (X) } 


pune-pe-bloc(X,Y): 
dacă {mana-tine(X), stiva(*, Y)) atunci STERGE{mana-tine(X), 
stiva(*, Y)} ADAUGA{stiva(*, Y, X), mâna-liberă) 


pune-pe-masă(X): 
dacă (mâna-ţine(X)) atunci STERGE{mana-tine (X) ) 
ADAUGĂ (stiva (X), mâna-liberă) 


iar pentru varianta de reprezentare din Figura 7c, următoarele reguli: 


ia-de-pe-bloc(X,Y): 
dacă (peste (X, Y), liber(X), mâna-liberă) atunci STERGE{peste(X, Y), 
liber (X), mâna-liberă) ADAUGA{liber(Y), mâna-ţine (X) ) 


ia-de-pe-masă(X): 
dacă (peste (X, masă), liber(X), mâna-liberă) atunci ŞTERGE (peste (X, 
masă), liber(X), mâna-liberă) ADAUGĂ (mâna-ţine (X) } 


pune-pe-bloc(X,Y): 
dacă {mana-tine(X), liber(Y)} atunci ŞTERGE(mâna-ţine(X), liber(Y) } 
ADAUGA{peste(X, Y), liber(X), mâna-liberă) 


pune-pe-masa(X): 
dacă {mana-tine(X)} atunci ŞTERGE {mâna-ține (X)} ADAUGA{peste (X, 
masa), liber(X), mâna-liberă) 


ia-de-pe-bloc(X,Y) 


pune-pe-bloc(X, Y) 


ia-de-pe-masa(X) 


pune-pe-masa(X) 


Figura 3.9: Regulile 
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3.3 Controlul sistemelor de productie 


3.3.1 Strategii irevocabile 


O strategie irevocabila este una in care orice miscare in spatiul starilor este 
ireversibila. Cale de intoarcere nu exista. O strategie irevocabila aparent merge la 
sigur. Dar imposibilitatea de a mai continua la un moment dat duce, inevitabil, la 
oprirea căutării şi deci eşec. Este ca şi cum aş cunoaşte deja soluţia şi atunci ma 
îndrept direct spre ea. Dar ce sens mai are căutarea dacă cunosc deja soluția? 
Distincția provine din gradul de cunoaştere a soluției problemei: cunoaştere globală 
(imaginati-va găsirea drumului într-un labirint privit dintr-un balon) fata de cunoaştere 
locală (labirintul privit de un om aflat în el). Un sistem de IA care lucrează cu o 
strategie irevocabilă are o cunoaştere locală a problemei, al aplicând o manieră 
generală de comportament în toate situațiile similare. 

e Metoda ascensiunii (hill climbing) 


Numele metodei este dat de analogia cu maniera de catarare pe un deal a 
unui orb. El nu e capabil sa vada varful dealului unde trebuie sa ajunga dar poate 
gasi in orice moment, incercand la fiecare pas in jurul lui cu bastonul, directia care-| 
face sa urce (Figura 3.10). Metoda ascensionala cauta sa atinga starea 
caracterizata de valoarea maxima a functiei euristice. Ea nu garanteaza gasirea unei 
solutii din cauza ca anumite probleme pot avea maxime locale sau platouri, dupa 
cum se sugerează în Figura 3.11. 


d 


Figura 3.10: Metoda Hill-climbing 


Figura 3.11: Maximele locale, iar uneori şi platourile, opresc înaintarea spre soluţie 
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procedure hill-climbing(initial-state) 
begin 
current-state <- initial-state; 
if (current-state e stare finală) return current-state; 
while (all-new-neighbour-states <- setul stărilor ce pot fi 
obținute din current-state prin operatorii aplicabili ei) 
{ elimină din setul all-new-neighbour-states toate stările 
deja vizitate; 
sortează all-new-neighbour-states în ordinea descrescătoare 
a valorilor funcției de cost; 
elimină din all-new-neighbour-states toate stările de cost 
mai mic decât current-state; 
if (all-new-neighbour-states + Ø) 
{ current-state <- prima clasată in 
all-new-neighbour-states) ; 
if (current-state e stare finală) return current-state; 
) 
else return FAIL; 
} 
return fail; 
end 


Iteratia datorată lui while semnifică aici tranzitarea pe rand în stări 
consecutive către soluţie. În această formă se permite deplasarea pe un platou, în 
sensul că o stare oarecare de aceeaşi valoare ca cea curentă poate fi selectată. 
Dacă însă la pasul al treilea din iteratie se modifică “mai mic” cu “mai mic sau 
egal”, atunci înaintarea pe platouri este invalidată. O variantă recursivă a acestui 
algoritm este următoarea: 


procedure rec-hill-climbing(current-state) 

begin 
if (current-state e stare finală) return current-state; 
all-new-neighbour-states <- setul stărilor ce pot fi obținute 


din current-state prin operatorii aplicabili ei; 
elimină din setul all-new-neighbour-states toate stările deja 
vizitate; 


sortează all-new-neighbour-states în ordinea descrescătoare a 
valorilor funcției de cost; 

elimină din all-new-neighbour-states toate stările de cost mai 
mic decât current-state; 

if (all-new-neighbour-states + ©) 
{ current-state <- prima clasată in all-new-neighbour-states); 

rec-hill-climbing(current-state); 

) 

else return FAIL; 

end 


Amorsarea rulării, în acest caz, se face prin apelul rec—hill- 
climbing(initial-state). 
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Sa observam in aceste proceduri: 

- valorile întoarse sunt fie o stare finală fie FAIL, dupa cum se găseşte ori 
nu o solutie; 

- desi generale, procedurile utilizeaza in cateva locuri informatie specifica 
problemei: recunoasterea unei stari ca fiind finala si functia de evaluare a 
stării; 

- jn ambele variante, prima stare “mai bună” decât cea curentă este aleasă. 
Introducerea sortări stărilor posibil de atins din starea curentă face ca 
dintre toate stările vecine să fie aleasă “cea mai bună”. Din acest motiv 
metoda se mai numeşte şi a gradientului maxim (stiffest gradient). 


A decide când o stare este „mai bună” decât alta presupune existenţa unui 
criteriu de comparare a stărilor între ele. Desigur afirmaţia dacă o stare este mai 
promițătoare decât alta poate fi hazardantă, pentru că adesea o stare care prezintă 
un potenţial mic se poate dovedi să conducă căutarea spre zone foarte interesante 
ale spaţiului stărilor. De aceea, de obicei această funcţie se bazează pe o 
euristică'?. Primul lucru ce trebuie avut in vedere atunci când se apelează la 
metoda hill-climbing este construirea unei astfel de funcţii, lucru nu întotdeauna 
uşor. 


Vom exemplifica o alegere a funcţiei euristice de calcul a costului stărilor pe o 
instanţă a problemei 8-Puzzle (Figura 3.12). 


-> [s| l4] 
7 [e [5 | 


Starea initiala Starea finala 


Figura 3.12: O instanță a problemei 8-puzzle 


Vom presupune că lucrăm cu operatorii cunoscuţi: mute-blanc-sus, 
mute-blanc-jos, mute-blanc-dreapta şi mute-blanc-stânga. Vom 
considera că funcţia euristică f atribuie stării curente ca scor numărul de piese aflate 
în poziţii finale. Cu acest criteriu, avem: 

f(stare iniţială) = 5; f(stare finală) = 8. 


12 O euristică este o metodă care, deşi nu întotdeauna riguroasă, poate fi de ajutor pentru găsirea unei soluții. 
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Figura 3.13: O parte dintr-un arbore de căutare pentru o 
instanță a problemei 8-puzzle 


Figura 3.13 arată o parte a arborelui de căutare pentru acest exemplu. 
Valorile funcției f sunt notate lângă desenele stărilor. Arcele semnifică tranzitii. 
Sagetile din micile pătrate ce însoțesc arcele sugerează numele operatorilor aplicaţi 
pentru realizarea respectivelor tranzitii. Figura 3.14 exemplifică un caz de oprire pe 
un maxim local. Deşi există un drum până la soluţie, ea nu poate fi atinsă pentru că 
stările învecinate stării de scor 7 (în elipsă) sunt toate mai slabe. Pe această figură 
s-a renunţat la notarea tranzitiilor inverse către stări prin care s-a mai trecut. Figura 
3.15 marchează stările poziţionate ascendent în funcţie de valorile lor. Se observă 
că nu există un drum în figură care să ajungă în starea de valoare maximă 8. 
Drumul punctat către starea finală sugerează că soluţia parcurge alte zone ale 
spațiului stărilor decât cea detaliată în exemplu. 
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Figura 3.14: Un exemplu de evolutie spre un 
platou (6) urmat de un maxim local (7) 


Ww 


an 
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Starea finală 


Starea inițială 


Figura 3.15: Maximul local fata de starea finală 
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3.3.2 Strategii tentative 


O strategie tentativă este una şovăitoare: o mişcare ce se dovedeşte greşită 
poate fi îndreptată (Cristea, 2002). Deplasările în spaţiul stărilor nu sunt fără 
întoarcere. Dacă am ajuns într-un punct mort, de exemplu într-o stare care nu mai 
are succesori, pot să "iau urma indarat" pentru a face o altă mişcare dintr-o poziţie 
anterioară celei curente şi în care am mai fost. In felul acesta se pot releva noi căi 
către soluţie. 


e Metoda ascensională cu revenire (backtracking hill climbing) 


Caracteristic pentru această metodă este faptul că utilizează o stivă în care 
memorează la fiecare pas stările vecine diferite de cea în care efectuează tranziţia. 
Stiva este apoi folosită pentru a recupera din ea alte stări în cazurile în care 
căutarea se “agaţă” în “fundaturi” de genul minimelor locale sau a stărilor fara 
succesori. Caracteristica de “întoarcere” sau “luare a urmei înapoi”, care este 
sugerată de numele metodei, nu trebuie înțeleasă strict în sensul revenirii, în 
situațiile de blocare, în stări prin care s-a mai trecut, ci de memorizare a unor căi 
case se ignoraseră la momentul deciziilor, pentru a putea fi reluate la momente 
ulterioare. Figura 3.16 lamureste. 


punct de decizie 1 


calea aleasă 


noduri amânate 
şi memorate 


nod amânat şi 
memorat 


a. În fiecare punct în care se face o alegere, b. Când structura de salvare este o stivă, 
căile neexplorate se salvează explorarea se face în ordinea întâi-în-adâncime 


Figura 3.16: “Întoarcerea” în cazuri de blocare înseamnă reconsiderarea unor 
căi salvate anterior 


procedure backtracking-hill-climbing(initial-state) 
begin 
stack = initial-state; 
while (stack) 
{ current-state = pop(stack); 
if (current-state e stare finală) return current-state; 
all-new-neighbour-states <- setul stărilor ce pot fi 
obținute din current-state prin operatorii aplicabili ei); 
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elimină din setul all-new-neighbour-states toate stările 
deja vizitate; 
if (all-new-neighbour-states + Ø) 
{ sortează all-new-neighbour-states în ordinea 
descrescătoare a valorilor funcției de cost; 
current-state <- prima stare clasată în 
all-new-neighbour-states) ; 
if (current-state stare finală) return current-state; 
else 
{ all-new-neighbour-states <- all-new-neighbour-states - 
(current-state); 
stack <- push(all-new-neighbour-states, stack); 


} 


} 
return FAIL; 


end 


Se observa ca ordonarea noilor stari gasite se face inainte de introducerea lor 
în stivă. Inseamna ca prima stare ce va fi considerată in continuarea stării curente 
este cea din care se poate ajunge cel mai sus din starea curentă, cu toate că e 
posibil ca în alte parti ale spaţiului de căutare să se afle stări (memorate în stivă) 
care să fie mai atrăgătoare (scoruri mai bun). De asemenea, să observăm că din all- 
new-neighbour-states n-au mai fost eliminate stările de cost mai mic decât current- 
state, ca în varianta fără revenire. Acest lucru înseamnă că atunci când se ajunge 
într-un punct de maxim local sau de platou, dacă alte stări noi pot încă fi atinse din 
starea curentă, ele se introduc în stivă chiar dacă se află „mai jos” decât starea 
curentă în drumul spre soluţie. Acest lucru permite abordarea altor căi neexplorate şi 
„părăsirea” vârfurilor locale sau a platourilor. Interzicerea introducerii în stivă a 
stărilor prin care s-a mai trecut împiedică intrarea în bucle infinite. 

Varianta de mai jos este cea recursivă. Parametrul de intrare al funcţiei este 
chiar stiva de stări. Intrarea se face cu un apel în care pe poziţia stivei este plasată 
starea inițială, adică: rec-backtracking-hill-climbing (push (initial- 
state,%)): 


procedure rec-backtracking-hill-climbing(stack) 
begin 
if null(stack) then return FAIL; 
current-state = pop (stack); 
if (current-state e stare finală) return current-state; 
all-new-neighbour-states <- setul stărilor ce pot fi obținute 


din current-state prin operatorii aplicabili ei; 
elimină din setul all-new-neighbour-states toate stările deja 
vizitate; 


sortează all-new-neighbour-states în ordinea descrescătoare a 
valorilor funcției de cost; 

elimină din all-new-neighbour-states toate stările de cost mai 
mic decât current-state; 

rec-backtracking-hill-climbing (push (a11l-new-neighbour-states, 

stack)); 


end 
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Funcţiile pop şi push au efect lateral asupra argumentului: în urma apelului, 
parametrul este modificat, respectiv stiva este decrementata sau incrementata. 
Valorile întoarse de ele sunt tot stive. 


e Metode de căutare sistematică (brute-force) 


Metodele de căutare sistematică (neinformate) investighează în totalitate 
spaţiul stărilor, plecând din starea iniţială, pentru găsirea unei căi către starea 
(stările) finală (finale). Aceste metode pot fi aplicate când spațiul stărilor este 
rezonabil de mic, în aşa fel încât să ne putem permite, în extremis, parcurgerea lui 
exhaustivă. 


- Căutare intai-in-adancime (depth-first search) 


În căutarea întâi-în-adâncime se utilizează o stivă pentru memorarea stărilor 
posibil de atins din starea curentă. Prin aceasta, înainte de a căuta în fraţii unui nod 
(stare), întâi fiii acestuia sunt căutaţi. Această ordine este dictată de faptul că, după 
vizitarea unui nod, întâi acesta este eliminat din stivă şi apoi fiii acestuia sunt 
introdusi în stivă. Datorită caracteristicii /ast-in-first-out ei vor fi parcurşi înaintea altor 
noduri aflate deja acolo. Când spaţiul stărilor este un arbore, căutarea întâi-în- 
adâncime parcurge arborele cu predilecție în adâncime, de unde şi numele metodei. 


procedure depthFirstSearch (root) 
begin 
stack <- push(root, ©); 
while (stack nu e goală) 
{ node <- pop(stack); 
if goal(node) then return node; 
else push(succesorii lui node, stack); 
} 
return FAIL; 
end 


Aceasta procedura testeaza solutia in fiecare nod al arborelui. Daca doar 
nodurile frunză sunt soluţii posibile, procedura se schimbă astfel: 


procedure leafDepthFirstSearch (root) 
begin 
stack <- push (root, ©); 
while (stack nu e goală) 
{ node = pop (stack); 
if not (leaf (node) ) 
else if goal (node) 
} 
return FAIL; 
end 


push(succesorii lui node, stack); 
then return node; 


Un dezavantaj al căutării în adâncime îl constituie posibilitatea ca algoritmul 
să nu se termine în cazul arborilor infiniti. Desigur în practică nu se lucrează cu 
arbori infiniti, dar problema rămâne pentru că e încă posibil ca algoritmul să 
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genereze un număr foarte mare de noduri chiar dacă soluţia se află pe un nivel 
superior, dar pe o ramură care nu e atinsă (de exemplu, în partea dreaptă a 
arborelui dacă parcurgerea fiilor se face de la stânga la dreapta). 


- Căutare întâi în lărgime (breadth-first search) 


La căutarea-în-lărgime parcurgerea avansează de-a lungul contururilor de 
adâncime egală. In felul acesta, dacă o soluție există, algoritmul garantează găsirea 
căii celei mai scurte până la un nod final. 


procedure breadthFirstSearch (root) 
begin 
queue <- in(root, ©); 
while (queue nu e goală) 
{ node <- out (queue); 
if goal(node) then return node; 
else in(succesorii lui node, queue); 


} 
return FAIL; 
end 


Dupa cum se constata algoritmul de cautare in largime nu difera de cel de 
cătare în adâncime decât prin structura de date utilizată, coadă în loc de stivă. Prin 
in şi out s-au notat aici operaţiile de introducere şi extragere din coadă (similarele 
lui push şi pop de la structura de stivă). O căutare în lărgime are mai mari şanse să 
găsească repede nodul soluţie aflat pe cel mai înalt nivel, decât o căutare în 
adâncime. 


e Metode de căutare euristică 


Metodele de căutare euristică se bazează pe aprecierea valorii unei stări ori a 
distanţei la care se află ea fata de o stare finală. Anumite euristici (generate de 
existența unor cunoştinţe asupra problemei) pot, în anumite cazuri, reduce efortul de 
căutare, dar, în acelaşi timp, metodele de acest tip nu mai garantează găsirea căii 
minime care era garantată la căutarea întâi-în-lărgime. Interesul este de a reduce 
atât dimensiunea soluţiei (ca lungime a ei sau cost), cât şi efortul de căutare pentru 
găsirea unei soluţii. Vom spune că o metodă P are o putere euristică mai mare 
decât o alta Q dacă combinaţia dintre costul soluţiei şi al găsirii ei în cazul lui P este 
mai mic decât în cazul lui Q. Pe de altă parte, dacă cel puţin o soluţie există, atunci 
o soluţie trebuie găsită. 

In cele ce urmează, pentru că spaţiul stărilor este organizat ca arbore sau 
graf, stările vor fi asociate nodurilor acestor structuri. 
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- Căutarea cel-mai-bun-intai (best-first) 


Dintr-un anumit punct de vedere, metoda de cautare cel-mai-bun-intai (best- 
first) poate fi considerată o combinare a metodelor depth-first si breadth-first. Ca si 
primele două si aici avem o structură care memoreaza nodurile ce urmează a fi 
vizitate. Această structură este aici o listă, fără organizarea particulară de stivă sau 
coadă. Spre deosebire însă de metodele menţionate, în cazul metodei cel-mai-bun- 
întâi trebuie făcută o apreciere a unui nod, printr-un scor ataşat lui, ce 
caracterizează “distanța” până la un nod final, sau dificultatea de a atinge soluția. 
Astfel văzut, un scor mic caracterizează o stare apropiată de final, iar un scor mare 
— una depărtată. La fiecare pas lista se sorteaza în ordinea crescătoare a scorurilor 
nodurilor ei, ceea ce permite să se aleagă pentru explorarea ce urmează cel mai 
promiţător (mai aproape de soluţie, sau mai uşor de atins) nod dintre cele ce se 
învecinează cu nodurile deja vizitate. Ca şi în cazul primelor două metode, metoda 
poate fi aplicată în egală măsură parcurgerii arborilor ori grafurilor. Metoda este 
descrisă de procedura bestFirstSearch() iar Figura 16 prezintă un exemplu de 
aplicare a ei pe un arbore. 


procedure bestFirstSearch (root) 
begin 
list <- include (root, ©); 
while (list nu e goală) 
{ node <- get-first (list); 
if goal (node) then return node; 
else 
{ include (succesorii lui node, list); 
sortează crescător list; 


} 
return FAIL; 
end 


În această procedură: include (x, y) este o funcţie care introduce un nod 
sau o listă de noduri x în lista y, get-first (x) — întoarce primul element al listei 
x, ştergând în acelaşi timp din lista x primul ei element. 
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Figura 3.17: Vizitarea unui arbore în ordinea cel-mai-bun-intai 


Cifrele de lângă nodurile din Figura 3.17 şi cele ce însoțesc ca puteri numele 
de noduri în Tabelul 3.1 reprezintă aprecieri ale costurilor până la atingerea soluției. 


Tabelul 3.1: Simularea parcurgerii arborelui din Figura 3.17 în ordinea 
cel-mai-bun-întâi 


Pasul | Nodul | Descendenti | Lista sortată 
vizitat 

0 (A) 

1 A B®, Cf (B®, 0% 

2 B D5, E8 (Cf, D5, E) 

3 e F°, G’, H” | (0°, F°, G7, H7, E$) 

4 D - (F°, G’, H’, E®) 

5 F ade (10, Jt, G7, H7, E8) 

6 l nod soluție 


Ordinea nodurilor parcurse nu corespunde cu calea. Dar calea poate fi 
reconstituită din noduri parcurse. Expl. 

Următoarea procedură reprezintă a adaptare a precedentei pentru cazul în 
care căutarea se face într-un spaţiu al soluțiilor descris de un graf, iar nu de un 
arbore. Se utilizează două liste de noduri: 

- open: fosta list din procedura aplicată pe arbori, care memorează noduri care au 
fost generate si pentru care s-a calculat funcția euristică aplicată asupra lor, dar 
care nu au fost inca vizitate. Elementele in această lista sunt întotdeauna sortate 
în ordinea crescătoare a valorilor functiei euristice; 
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- closed: lista nodurilor care au fost deja examinate. Ea e necesară în cazul 
structurii de graf, întrucât, la fiecare generare a unui nou nod, lista este căutată şi 
nodul este generat numai dacă el nu există deja în closed. 


procedure bestFirstSearchOnGraph (start) 
begin 
open <- include(start, ©); 
closed <- ©; 
while (open nu e goală) 
{ node <- get-first (open); 
if goal(node) then return node; 
else 
{ closed <- include (node, closed); 
succ <- lista succesorilor lui node; 
new-succ <- succ \ closed; 
new-succ <- new-succ \ open; 
/* new-succ reprezintă lista succesorilor lui node care 
nu sunt in closed si nici in open, deci nu au fost inca 
vizitati si nici pusi in asteptare. */ 
open <- include(new-succ, open); 
sorteaza crescător open; 


} 
return FAIL; 
end 


Diferenta fata de alg A. 


- Recuperarea soluţiei în metodele de căutare sistematică şi euristică pe arbori 


În toate procedurile prezentate până acum am considerat că ne interesează 
în ieşire doar nodul final şi nu calea până la el. Această presupunere este însă în 
contradicție cu cele afirmate deja relativ la ce înseamnă o soluţie la o problemă de 
IA spre deosebire de o problemă din afara spaţiului IA (v. secțiunea 3.1.1). Atunci 
când spaţiul de căutare are structura unui arbore, generarea căii este simplă, dacă 
fiecare nod în structură are memorată o legătură către părinte. Practic, parcurgând 
înapoi drumul din nodul soluţie până în nodul rădăcină se obţine inversa unei căi 
către soluție. Atunci însă când arborele nu este explicitat ca o structură, el fiind 
generat ad-hoc la parcurgerea spațiului, situația se schimbă. Calea spre soluție 
trebuie generată o dată cu efectuarea căutării. In cele ce urmează vom relua 
algoritmii de căutare exhaustivă pe arbori, prezentaţi până acum, cu această grijă în 
minte. Vom prefera să lucrăm pe variantele recursive ale acestor algoritmi. Mai întâi, 
varianta recursivă a căutării întâi în adâncime: 


procedure recDepthFirstSearch (stack) 
begin 
if empty(stack) then return FAIL; 
node <- pop(stack); 
if goal(node) then return node; 
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recDepthFirstSearch (push (succesorii lui node, stack)); 


end 


Primul apel trebuie să fie: recDepthFirstSearch (push (root,@)). Similar, 
varianta recursivă a procedurii de căutare întâi în lărgime este: 


procedure recBreadthFirstSearch (queue) 
begin 
if empty(queue) then return FAIL; 
node <- out (queue); 
if goal(node) then return node; 
recBreadthFirstSearch(in(succesorii lui node, queue)); 


end 


cu apelul initial recBreadthFirstSearch(in(root,®)). Varianta recursivă a 
funcţiei de căutare cel-mai-bun-întâi este: 


procedure recBestFirstSearch (list) 
begin 
if empty(list) then return FAIL; 
node <- get-first (list); 
if goal(node) then return node; 
recBestFirstSearch (sort (include (succesorii lui node, list))); 


end 


cu apelul initial recBestFirstSearch (include (root, 9) ). Prin funcţia sort, 
aplicată aici unei liste, înțelegem sortarea crescătoare a scorurilor nodurilor care 
sunt elementele listei. În toate aceste proceduri empty este o funcţie care întoarce 
TRUE dacă argumentul (stivă, coadă sau simplă listă) este vid. 


Şi acum să construim variantele acestor algoritmi care se preocupă totodată 


de recuperarea căilor către soluţie. lată-le, în aceeaşi ordine: 


procedure recGetPathDepthFirstSearch (stack) 
begin 
if empty(stack) then return FAIL; 
(node,path) <- pop(stack); 
if goal(node) then return path; 
succ <- succesorii lui node; 


while (n <- one of succ) push(<n, path 


° n>, stack); 


recGetPathDepthFirstSearch (stack) ; 


end 


Diferenţele acestei variante de căutare întâi-în-adâncime fata de precedenta 


sunt următoarele: 


elementele stivei sunt acum formate din pereche de genul <nod, cale>, unde 
nod este un nod al arborelui, iar cale este o secvenţă de noduri, configurând o 
soluție parţială, între rădăcină şi nod; 

singurul apel recursiv al funcţiei se detaliază acum în două apeluri pentru că 
trebuie făcută diferența între cazurile în care nodul curent are ori nu 
descendenţi. Dacă el nu are descendenţi (succ == ©), atunci calea nu se 
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modifica, pentru ca practic stiva reculeaza cu nodul curent, ce fusese scos prin 
operatia pop. Daca are descendenti, atunci in stiva se includ perechi formate 
din fiecare nod descendent si calea corespunzatoare la care se adauga nodul 
descendent (prelungirea căii vechi cu nodul nou este notată path ° n, pentru 
a sugera o concatenare); 
- valoarea întoarsă este, de data asta, o cale iar nu un simplu nod. 
Apelul inițial trebuie acum să fie de forma: 
recGetPathDepthFirstSearch (push<root, root>,@). În aceeasi maniera, 
funcția de căutare întâi-în-lărgime devine: 


procedure recGetPathBreadthFirstSearch (queue) 
begin 
if empty(queue) then return FAIL; 
(node, path) <- out (queue); 
if goal(node) then return path; 
succ <- succesorii lui node; 
if (succ == ) recGetPathBreadthFirstSearch (queue); 
else while (n <- one of succ) 
recGetPathBreadthFirstSearch (in (<n,path 
end 


° n>,queue)); 


cu apelul initial recGetPathBreadthFirstSearch (in<root, root>, Ø). În 
fine, varianta ce se preocupă de generarea soluţiei pentru funcţia de căutare cel- 
mai-bun-întâi devine: 


procedure recGetPathBestFirstSearch (list) 
begin 
if empty(list) then return FAIL; 
(node, path) <- get-first (list); 
if goal(node) then return path; 
succ <- succesorii lui node; 
while (n <- one of succ) include(<n,path ° n>,list); 
recGetPathBestFirstSearch(sort (list)); 
end 


al carei apel initial trebuie sa fie exprimat ca: 
recGetPathBestFirstSearch (include<root, root>, Ø). În această variantă 
a procedurii de căutare cel-mai-bun-întâi, se presupune că funcţia sort sortează 
perechi <nod, cale> pe baza strict a scorurilor nodurilor, deci fără a se preocupa 
de căile ataşate. 


Recuperarea soluţiei în metodele de căutare euristică pe grafuri. Algoritmul 
A* 


Mai avem de rezolvat o problemă, şi anume, cum se face recuperarea căii 
atunci când structura e un graf iar nu un arbore. Problema revine la calculul 
drumurilor de cost minim în grafuri, considerată o problemă clasică de căutare în 
grafuri, dar, în acelaşi timp, şi o problemă de IA. In general, în problemele de acest 
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gen, aprecierea costurilor este făcută de o funcţie euristică f care exprimă costul ca 
o sumă a două valori: 
g — un cost al traversării grafului din nodul start până în nodul curent, si 
h — un cost al estimării traversării grafului din nodul curent până într-un nod final: 
f=gth 


Toate valorile funcţiilor g şi h trebuie sa fie pozitive. Evident ca precizia funcţiei 
euristice reflectă cantitatea de informaţie pe care ea o incorporează relativ la 
domeniul problemei. O funcţie h identic nulă reflectă lipsă totală de informaţie asupra 
problemei (cazul în care nu se poate face nici o estimare asupra aproprierii de 
soluţie a unei stări). 

Următoarea procedură este o variantă a căutării best-first, cunoscută sub 
numele de algoritmul A (Hart, et al., 1968). Procedura generează atât o parte a 
grafului stărilor problemei cât şi un subset al său numit arbore de căutare (aşadar, 
în care fiecare nod are un unic părinte). La fiecare pas al iteratiei exterioare, nodurile 
din open reprezintă noduri frunză ale arborelui de căutare. In derularea algoritmului, 
nu numai că arborele de căutare se extinde în graful generat dar îşi poate schimba 
şi forma în aşa fel încât unele noduri îşi modifică părinţii. Când o frunză a arborelui 
de căutare atinge un nod final, atunci căutarea se termină şi pentru că fiecare nod al 
acestui arbore îşi cunoaşte părintele, soluţia este dată de calea inversă de la nodul 
final la nodul de start. 


procedure A(start-node) 
begin 

start-node.back-score = 0; 

start-node.forth-score = euristics (start-node) ; 

/* Presupunem că atasdm fiecărui nod trei fațete: 

/* back-score - costul căii de la rădăcină la nod; 

/* forth-scor aprecierea costului de la nod la destinație; 

/* father - nodul lui părinte în drumul spre soluţie. 

open <- (start-node); 

closed <- ©; 

while (open) 

{ open <- sort (open); 
/* Sortarea se face în ordinea crescătoare a valorilor lui 
/* f (respectiv node.back-score + node.forth-score). 
current-node <- first (open); 
open = open \ {current-—node}; 
closed <- closed U {current-—node}; 
if goal (current-node) 
return generatePath(current-node, start-node); 

/* Funcţia generatePath() generează soluția ca inversul 
/* drumului de la current-node la start-node, cale dată 
/* de fatetele father ale nodurilor din arborele parcurs din 


graf. 


pairs <- generateSuccessors (current-node) ; 
/* Vom considera că funcţia generateSuccessors generează 
/* perechi (node, score) formate dintr-un nod si scorul 
/* tranziţiei din current-node în respectivul nod. 
while (pairs) 

{ (node, score) <- first (pairs); 
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if (node e open U closed) 
{ /* Înseamnă că node a mai fost deja generat sau a 
/* fost chiar procesat. 
if (current-node.back-score + score < 
node.back-score) 
{ /* Dacă scorul calculat până la acest nod deja 
/* vizitat este mai mic pe această cale decât pe 
/* cea din care a fost el generat anterior, 
/* atunci i se actualizează scorul si i se 
/* schimbă părintele. 
node.back-score <- current-node.back-score + 
score; 
node.father © current-node; 
updateDescScores (node) ; 
/* Actualizarea scorurilor descendentilor lui 
/* node din graf care au mai fost vizitate se face 
printr-o parcurgere 
/* depth-first a nodurilor posibil de atins 
/* plecând de la node. Algoritmul se stinge în 
/* nodurile care nu au succesori cât şi în cele 
/* care nu au fost atinse pe o cale care l-a inclus 


pe node. 


else 
{ node.father <- current-node; 
node.back-score <- current-node.back-score + 
score; 
node.forth-score <- heuristics(node); 


open <- open U {node}; 
/* Funcţia heuristics() apreciază o valoare a căii 
/* de la nodul argument până la scop. 


) 
return FAIL; 
end 


[4] [6] 
0-0; QA 
Figura 3.18: Un spatiu al stărilor reprezentat ca graf în care arborele de căutare 
evoluează fără reveniri 
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Tabelul 3.2, redă paşii aplicării algoritmului pe spațiul stărilor din Figura 3.18. 
Graful stărilor este indicat prin noduri, etichetate cu litere, şi arce care unesc 
nodurile şi care semnifică tranzitii. Nodul start este aici A şi nodul final — H. Vom 
considera că o tranziţie costă o unitate. Asta înseamnă că o soluție (o cale care 
uneşte nodul start de nodul destinaţie) costă exact cât lungimea ei (în număr de 
arce). Numerele în chenare pătrate de deasupra şi în dreapta nodurilor grafului în 
Figura 3.18 indică paşii în care respectivele noduri au fost prelucrate (drept current- 
node). Numerele din cercurile cu fond întunecat plasate în dreapta şi jos fata de 
noduri indică costurile căilor până la ele din nodul de start. Legăturile către nodurile 
părinţi în arborele de căutare rezultat sunt indicată de săgețile plasate lângă arce 
(întotdeauna în sens invers arcului). Nodurile întunecate sunt cele care au ajuns în 
lista closed. 

Pentru exemplul de fata vom considera o funcţie euristică constantă (evident, 
o astfel de funcţie este complet neinteresantă într-un caz concret, pentru că nu 
diferenteaza între noduri şi ca urmare nu influențează sortarea din algoritm; o astfel 
de funcţie transformă algoritmul într-unul neinformat). In exemplul nostru toate 
nodurile vor avea valoarea forth-score, dată de această funcţie, egală cu 7. 


Tabelul 3.2: Trasarea unui exemplu în care nu se revine asupra deciziilor (pe spatiul 
stărilor din Figura 3.18) 


Pas | current-node pairs: ( (node, score) } open closed 
0 (A) Ø 
1 JA ((B,1)) (B) (A) 
(A. £=nil, A.bs=0, B.£=A, B.bs=1, B.fs=0 
A.fs=7) 
2 |B ((C,1),(G,1)) (C,G) | (A,B) 


C.f=B, C.bs=2, C.fs=0 sortată: 
G.f=B, G.bs=2, G.fs=0 (C,G) 


3 JC ((D,1),(F,1)) (G,D,F) | (A,B,C) 
D.£=C, D.bs=3, D.fs=0 sortată: 
F.£=C, F.bs=3, F.fs=0 (G,D,F) 


4 |G ((H,1)) (D,F,H) | (A,B,C,G) 
H.£=G, H.bs=3, H.fs=0 sortata: 
(D,F,H) 
5 |D ((E,1)) (F,H,E) | (A,B,C,G,D) 
E.f=D, E.bs=4, E.fs=0 sortata: 
(F,H,E) 
F ((G,1)) (H,E) (A,B,C,G,D,F) 
H — goal(H)=TRUE (E) (A,B,C,G,D,F,H) 
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Simularea rularii algoritmului din Tabelul 3.2 releva ca un singur nod satisface 
testul node e open U closed, anume G, generat a doua oară ca descendent al 
nodului F la pasul 6 (current-node = F şi node = G). Pentru acest nod testul 
current-node.back-score + score < node.back-score este evaluat la FALSE 
(într-adevăr 3+1 > 2). Asta înseamnă că drumul până la G ca A-B-C-F-G este mai 
lung decât cel găsit anterior ca A-B-G. Din acest motiv părintele nodului G nu se 
schimbă. 

Să luăm însă exemplul grafului din Figura 3.19 şi să considerăm că, dintr-un 
motiv oarecare, funcția euristică pe care o avem la dispoziţie apreciază ca forth- 
score pentru nodurile F şi J valoarea 20, valorile tuturor celorlalte noduri fiind 10. 
Atunci evoluţia algoritmului ar fi dată de Tabelul 3.3. 


Q= i = a. Pasii 1-8 
tL. 
Q; 

Q = 

oy = b. Pasii 9-11 


> — 


Figura 3.19: Un spatiu al stărilor reprezentat ca graf în care arborele de căutare 
evoluează cu reveniri 
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Tabelul 3.3: Derularea algoritmului în caz de revenire asupra deciziilor (pe spațiul 


stărilor din Figura 3.19) 


Pas | current-node pairs: ( (node, score) } open closed 

0 (A) D 

l een A.bs=0, (04) 6) (A) 

A.£s=7) B.£=A, B.bs=1, B.fs=10 

2 |B ((C,1),(G,1)) (C,G) | (A,B) 

C.f=B, C.bs=2, C.fs=10 sortata: 
G.£=B, G.bs=2, G.fs=10 | (C,G) 
3 IC ((D,1),(F,1)) (G,D,F) | (A,B,C) 
D.£=C, D.bs=3, D.fs=10 sortata: 
F.f=C, F.bs=3, F.fs=20 (G,D,F) 
4 |G () (D,F) (A,B,C,G) 
sortata: 
(D,F) 

5 |D ((E,1)) (F,E) (A,B,C,G,D) 

E.f=D, E.bs=4, E.fs=10 sortata: 
(E,F) 

6 |E ((F,1),(H,1)) (F,H) (A,B,C,G,D,E) 

H.£=E, H.bs=5, H.fs=10 sortata: 
(H, F) 

7 |H ((I,1)) (F,l) (A,B,C,G,D,E,H) 

I.£=H, |.bs=6, l.£s=10 sortata: 
(LE) 

8 || ((J,1)) (F,J) (A,B,C,G,D,E,H,| 

J.f=l, J.bs=7, J.fs=20 sortata: ) 
(F,J) 

9 IF ((G,1)(1,1)) (J) (A,B,C,G,D,E,H,I 
L£=F, |.bs=4, |.£5=10 LE, 
updateDescScores (I) > 
J.f=l, J.bs=5 

10 |J ((K,1)) (K) (A,B,C,G,D,E,H,I 
Kind K.bs=6, K.fs=10 Fd) 

11 | K—goal(K)=TRUE | () () (A,B,C,G,D,E,H,| 

,F,J,K) 
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În Figura 3.19a se prezintă paşii 1-8. Datorită valorii mare a funcţiei euristice 
nodul F a fost ocolit în parcurgere, fiind trecut la fiecare sortare a listei open în 
coada ei (paşii 3-7). In Figura 3.19b sunt dati paşii 9-11. In momentul în care nodul F 
devine nod curent are loc o rearanjare a valorii de back-score a nodului |, 
descendent al lui F şi valoarea acestuia este corectată de la 6 la 4. Această 
reaşezare poate influenţa toate nodurile ce pot fi atinse din F şi care fuseseră deja 
calculate. Apelul funcţiei updateDescScores (1) realizează acest lucru. Ca urmare 
şi valoarea nodului J se modifică de la 7 la 5. 

Să observăm că dacă ceea ce interesează e numai găsirea unei căi spre 
soluție, atunci putem face g(n)=0 în fiecare nod n. După cum am văzut în cele două 
exemple de mai sus, dacă dorim cea mai scurtă cale spre soluție, atunci g(n)=nr. de 
paşi până în n (costul unei căi = 1) şi rezultatul e similar unei căutări breadth-first. 
Dacă fiecare operator are un alt cost, şi se doreşte cea mai ieftină cale, atunci g 
poate oglindi costul căii. 

Dacă algoritmul A foloseşte o funcţie euristică h care este o limită inferioară a 
costului căii optime de la un nod n la ţintă, atunci el se numeşte A*. Următoarele 
rezultate se cunosc despre A* (v. Nilsson, 1980): 

e A*setermină întotdeauna în grafuri finite; 

e dacă o cale există de la nodul start la o soluţie, atunci A* se termină (chiar 
dacă graful e infinit); 

e A'eadmisibil (adică, dacă există o cale de la nodul de start la un nod soluție, 
A* găseşte o cale optimă). Spunem că un algoritm A» e mai informat decât A4, 
daca, pentru toate nodurile n diferite de soluţie, h2(n) > h(n). 

e Daca A; si A2 sunt două versiuni ale lui A*, astfel încât A2 e mai informat 
decât A4, atunci la terminarea căutărilor lor pe orice graf în care există o cale 
de la nodul start la un nod soluţie, orice nod expandat de A» este de 
asemenea expandat şi de A. Urmează ca A; expandează cel putin tot atâtea 
noduri ca şi Ao. 


3.4 Sisteme Expert 
3.4.1 Tipuri de căutări 


Am văzut în acest capitol câteva metode de a organiza o căutare în spațiul 
stărilor pentru găsirea soluţiei unei probleme de IA. Maniera de căutare a fost 
întotdeauna dinspre o stare considerată iniţială către o stare considerată finală, fie 
că stim cu exactitate acea stare, fie că o cunoaştem doar prin anumite condiţii care 
sunt verificate de ea. Parcurgerea spațiului stărilor este deci întotdeauna “către 
înainte” (forward-looking), sau plecând de la premize pentru a ajunge la o concluzie. 
Dar aceasta nu e singura posibilitate: la fel de bine putem adopta o manieră de 
căutare care pleacă dinspre concluzie pentru a verifica dacă avem premize care s-o 
verifice. Maniera se numeşte “căutare înapoi” (backward-looking). Limbajul Prolog 
implementează o astfel de strategie. In sfârşit se poate vorbi şi de o căutare 
bidirectionala, în care se pleacă simultan dinspre premize şi concluzie în încercarea 
de a găsi o cale care să le unească. 
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3.4.2 Sistemele Expert (SE) 


Un Sistem Expert este un program capabil de a incorpora si folosi cunostinte 
echivalente cu cele pe care le are un expert uman într-un anumit domeniu. Un shell 
(sau o “carapace”) de SE este ceea ce ar rămâne dintr-un SE daca l-am goli de 
cunoaşterea expert. El este, aşadar, un sistem de control capabil de a efectua o 
căutare într-un spaţiu al stărilor, de aceea se mai numeşte şi motor de inferente. 


Premiza principală în construcţia unui SE este aceea că un expert îşi 
construieşte soluţia la o problemă din piese elementare de cunoaştere pe care le 
selectează şi le aplică într-o anumită secvenţă. Pentru a furniza o soluţie coerentă la 
o problemă dată cunoaşterea cuprinsă într-un anumit domeniu trebuie aşadar 
formalizată, apoi reprezentată corespunzător şi în final manipulată în conformitate cu 
o anumită metodă de rezolvare de probleme. Se pune astfel în evidenţă diviziunea 
dintre secțiunea care păstrează reprezentarea cunoaşterii asupra domeniului — baza 
de cunoştinţe, formată dintr-o colecţie (bază) de fapte împreună cu o colecţie 
(bază) de reguli şi diviziunea responsabilă cu organizarea proceselor inferentiale 
care să implice aceste cunoştinţe — sistemul de control. 

Un shell foarte cunoscut de SE este CLIPS (Giarratano, Riley, 1998). 


3.5 Concluzie 


Rezolvarea unei probleme de IA are două aspecte: 
e formalizarea problemei = găsirea unei reprezentări pentru stările problemei şi 
găsirea unei reprezentări pentru reguli; 
e lansarea unei căutări în spaţiul stărilor în scopul determinării unei căi între starea 
considerată iniţială şi o stare finală. 
Când un astfel de drum nu poate fi găsit spunem că problema nu are soluție. 
Aceste concluzii pun în evidenţă şi preocupările majore ale domeniului: 
găsirea celor mai adecvate procedee de reprezentarea a problemelor, respectiv 
găsirea celor mai eficiente procedee de navigare în spaţii ale stărilor. 


Cerinţe pentru studenți: 


Să recunoască încadrarea unei probleme în clasa de probleme IA. 

Să deosebească o problemă de o ipostază de problemă. 

Să identifice spaţiul stărilor problemei şi să-i aprecieze mărimea. 

Să construiască o reprezentare adecvată a stărilor. 

Să identifice regulile şi să construiască o reprezentare neformală a lor. 
Să hotărască asupra unui tip de căutare a soluţiei. 

Să poată adapta algoritmul la cerinţele particulare ale problemei. 
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Probleme 


P3.1 Recuperarea soluţiei: să se modifice algoritmii hill-climbing() şi rec-hill- 
climbing () din secţiunea 3.3.1 pentru a-i face să întoarcă: a). o secvenţă de stări prin 
care se trece în drumul de la starea inițială până la cea finală; b). o secvenţă de operatori 
care aplicaţi stării iniţiale să ducă la obţinerea stării finale. 


P3.2 Aceleaşi cerințe pentru algoritmii backtracking-hill-climbing() şi rec- 
backtracking-hill-climbing() din secţiunea 3.3.2. 


P3.3 Să se figureze un arbore a soluţiei pentru instanța problemei cuburilor dată în Figura 
3.20, în care funcţia euristică adaugă, pentru fiecare bloc, 1 — dacă stă pe blocul pe care ar 
trebui să ajungă şi scade 1 — dacă nu stă pe blocul pe care ar trebui să ajungă. Operatorii 
sunt cei cunoscuţi din secțiunea 3.2.2. 


a. starea inițială b. starea finală 


Figura 3.20: O instanță a problemei cuburilor cu cinci piese 


P3.4 Să se descrie funcţia updateDescScores(node) din componența algoritmului A (v. 
secțiunea 3.3.2). 


P3.5 Să se descrie funcţia generatePath(current-node, start-node) din componenţa 
algoritmului A (v. secţiunea 3.3.2). 


P3.6 Se dă o gramatică independentă de context şi o frază. 

a). Să se precizeze diferenţa dintre o problemă şi o instanţă de problemă în acest caz. 

b). Să se dea exemple de alte instanţe ale aceleiaşi probleme. 

c). Să se explice ce înseamnă o stare în rezolvarea acestei probleme si care e 
reprezentarea unei stări. 

d). Să se formalizeze ca o problemă de căutare în spaţiul stărilor problema recunoaşterii 
dacă fraza face parte din limbajul generat de gramatică. 

e). Ce strategie consideraţi adecvată pentru rezolvare? 

f). Să se dea exemple de două soluţii posibile (derivari). 


Exemplu pentru: G = (NT, T, S, P), unde: 


NT = {S, NP, VP, N, V} 
T = {calul, lacrima, duce}, iar 
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P ={S > NP VP, NP > NP NP, NP > N, VP > V NP, VP > V, N > calul, N > lacrimă, N 
> duce, V > duce, V > lacrimă) 


şi propoziţia: "calul duce lacrimă". 


P3.7 În testele de inteligență apar probleme în care este dată o secvenţă de numere şi se 
cere să se găsească formula prin care se determină succesorul. Vi se cere să rezolvati prin 
mijloace specifice IA o astfel de problemă. Descrieti un algoritm care să găsească o soluţie 
a unei astfel de probleme, presupunând existența unei proceduri st ripssearch (n1,n2), 
unde n1 şi n2 sînt două numere din secvenţă. Procedura stripsSearch() realizează o 
căutare într-un spaţiu al stărilor în care n1 este o stare iniţială iar n2 — una finală, căutând o 
cale de aplicaţii de reguli. O regulă în această formalizare transformă un număr într-un alt 
număr. Procedura stripsSearch() întoarce o listă de secvenţe de reguli. Numărul de 
aplicaţii ale procedurii stripsSearch() este dat de numărul de secvențe consecutive de 
două numere ce se cuprind în secvența originală. După fiecare apel al procedurii 
stripsSearch() numărul de secvenţe de reguli rămas trebuie să fie mai mic sau cel mult 
egal cu cel anterior. În mod ideal, la terminarea acestei faze, o singură cale trebuie să 
rămână. Soluţia problemei va trebui dată de aplicarea căii asupra ultimului număr din 
secvenţa dată. 


P3.8 Pentru a controla explozia exponențială care poate să apară în anumite probleme de 
investigare a spaţiului stărilor, se recurge la o îngrădire a listei nodurilor ce vor fi exploatate, 
retinand la fiecare pas primii N cei mai promitatori candidaţi. Varianta se numeşte beam- 
search. Descrieti un astfel de algoritm de căutare pe arbori. 


P3.9 Să se găsească o reprezentare adecvată pentru o stare în jocul de şah şi apoi să se 
modeleze mutările calului şi ale nebunului. 


P3.10 a). Descrieti in Lisp regula M-right prin care un singur misionar se deplasează pe 
malul din dreapta. Forma generală a regulii trebuie să fie: if CONDIȚII then ACȚIUNI; 

b). Descrieti o funcţie de scor pentru problema canibalilor şi misionarilor; 

c). Poate problema misionarilor şi canibalilor să aibă o rezolvare printr-un algoritm de tip hill- 
climbing? Explicati. 


P3.11 Să se formalizeze ca o problemă de căutare în spatiul stărilor următoarea problema 
de aliniere: se dau două semnale, fiecare fiind format dintr-o secvenţă de segmente de linie 
dreaptă aflate unul în prelungirea celuilalt (ca în Figura 3.21). Fiecare segment e 
caracterizat de o lungime (pe axa orizontală) şi o pantă. Se doreşte să se obține cea mai 
bună aliniere între cele două semnale. In evaluarea unei alinieri contează lungimea 
segmentelor şi panta acestora. 


Figura 3.21: Alinierea a două semnale codificate ca secvențe de linii frânte 


P3.12 Se consideră un joc ce se desfăşoară pe o tabla 3 x 3 pe care sunt plasate piese albe 
şi negre (Figura 3.22). Fiecare dintre cei doi jucători are asignată câte o culoare. La o 
mutare, un jucător poate selecta un dreptunghi, piesele din interiorul dreptunghiului urmând 
să-şi schimbe culoarea. Câştigă primul jucător care obţine pe tablă toate piesele în culoarea 
lui. 
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ejolo! lelole| [elolo 
o|olo| |oioloi lolelei 
Cleo) loielo; lolole 


Figura 3.22: O secvență de trei mutări în evoluţia jocului 


a). Să se propună un set de predicate care să facă posibilă descrierea stărilor jocului. Cu 
ele să se definească starea inițială (figura din stânga) şi starea finală. 

b). Să se propună reguli pentru modelarea mişcărilor jucătorilor. 

c). Să se propună o funcţie de evaluare a unei stări şi un algoritm de control. 


P3.13 Se dă o tablă de şah pe care se găsesc initial plasați cai. Ei se deplasează, utilizând 
salturile caracteristice calului din jocul de şah, întotdeauna spre hambar (colțul din stânga 
sus al tablei). Mişcările se termina când unul din cai reuşeşte să ajungă în hambar. 

a). Să se propună un set de predicate care să fie utilizate în reprezentarea unei stări şi, cu 
ajutorul lor, să se descrie o stare iniţială. 

b). Să se descrie un set de reguli care să realizeze mutările cailor. 

C). Să se descrie o secvenţă de mutări care să conducă spre soluție. 

P3.14 Doi parteneri, A şi B, stau fata în fata: B şi-a pus în minte un număr între 1 şi 10 pe 
care A trebuie să-l ghicească. A propune numere iar B răspunde prin “da”, “mai mic” sau 
“mai mare”. 

a). Formulati acest dialog ca o problemă IA. 

b). Descrieti secvenţa de reguli aplicate si de stări generate când B alege numărul 7. 


P3.15 Într-un joc pe calculator intervin următoarele elemente: 


e un omulet, care este un obiect uşor dar dur, se poate mişca în toate direcţiile, 
poate împinge obiecte şi mânca inimioare, când se află 
lângă acestea; 


e două bile, care sînt obiecte dure şi grele; 


bombă, care poate exploda dacă un obiect dur cade 
peste ea sau dacă ea cade peste un obiect dur, caz în care se 
autodistruge şi distruge orice obiect aflat în imediata apropiere; 


e  inimioară, care este un obiect dur şi greu; 


e cinci parcele de pajişte care sînt obiecte moi ce se distrug la 
trecerea omuletului; 


e un balon, care poate înălța un singur obiect greu dar care e 
susținut de pajiste; 


e usa, care se deschide cand omuletul a mâncat inimioara. 


olie @O >o 


Figura 3.23: Starea initială a jocului 


Un obiect greu poate cădea atunci cand nu e sustinut. Un obiect usor nu cade. 

a). Să se imagineze un set de predicate cu ajutorul cărora să se reprezinte starea din Figura 
3.23. 

b). Să se descrie acțiunile posibile din acest mic univers ca un set de reguli de productie. 

c). Să se imagineze secventa de aplicari de reguli prin care omuletul poate ieşi prin usa. 


P3.16 Descrieti într-un eseu elementele de inteligență artificială pe care vi le imaginati 
incorporate în casa viitorului (max 2 pagini). Dati cit mai multe indicaţii de modelare. 
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P3.17 Ceea ce urmează reprezintă formularea unui joc numit Lives şi atribuit 
matematicianului John Conway de la Univ. Cambridge: 


Există a tablă pătrată (presupus infinită) pe care se pot dezvolta celule. Fiecare poziție 
de pe tablă poate evolua în funcţie de starea ei şi a celor opt vecini ai săi conform a 


trei reguli: 

1. Supravietuire. Orice celulă vie care se învecinează cu două sau trei alte celule vii 
supravieţuieşte. 

2. Moarte. Orice celulă vie care se învecinează cu patru sau mai multe celule vii 
moare de suprapopulare. Orice celulă vie care se învecinează cu una sau nici o 
celulă vie moare de izolare. 

3. Nastere. In orice locaţie goală care se învecinează cu exact trei celule vii va apare 


o celulă vie. 


Toate regulile se calculează întâi pentru fiecare celulă şi se aplică odată pentru a da 
naştere la următoarea generaţie a tablei. 


Într-o anumită implementare a jocului prin reguli de producție, s-a preferat o reprezentare în 
care pentru fiecare locaţie de coordonate (x, y) a tablei se cunosc, la orice moment, 
următoarele predicate: 


current -value (x,y, v) — cu semnificaţia că valoarea curentă a locației este 

ve (empty, cell); 

new-value (x,y, v) — cu semnificaţia că valoarea la generaţia următoare a locației 

trebuie să fie ve (empty, cell}; 

neighbour (x,y, n) — cu semnificaţia că numărul de celule vii învecinate locatiei 

este n (0<ns<8); 

tested(x,y,t) — cu semnificația că locaţia este deja calculată pentru noua 

generaţie (t= true), ori nu (t= false). 

- Descrieti un set de operatori care guvernează evoluţia simulată a jocului. 
Precizati mecanismele suplimentare de control şi reprezentare 
de care aveţi nevoie pentru secventierea fazelor; 

- Descrieti prin setul de predicate precizat anterior următoarea |e|e|e 
stare iniţială: 


Figura 3.24: Starea iniţială a jocului LIFE 


- Descrieti o secvenţă de reguli care produc două generaţii de celule plecând de la 
starea iniţială precizată şi aratati care va fi configuraţia ultimei generaţii din cele 
două. 
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Capitolul 4 
Reprezentarea cunoasterii 
si rationament 


Bine, atunci: care e viteza intunericului? 
Wright Stevens 


Realitatea este tot ceea ce ne înconjoară. La baza interacțiunii noastre, ca 
sisteme vii, cu realitatea stau necesitățile şi dorințele noastre. Credem că sediul 
acestor imbolduri este creierul nostru şi tot acolo realitatea trebuie să fie reflectată 
într-un anume fel. La masă fiind, întindem mâna după solnita, o apucăm şi o 
scuturăm deasupra grătarului de vită din farfurie, după care o aşezăm la loc. Facem 
toate acestea mai întâi pentru că „ne place” mâncarea mai sărată şi apoi pentru că 
„vrem” să ne satisfacem acest gust. Apoi „ştim” că sarea se află în solnita, că o 
putem face să iasă din solnita şi presăra peste mâncare prin scuturare deasupra ei, 
că pentru a aduce solnita deasupra farfuriei trebuie să o apucăm cu mâna, să o 
răsturnăm deasupra farfuriei şi să o scuturăm, după care, în mod normal, trebuie să 
o repunem pe masă de unde am luat-o. Suntem apoi capabili să „recunoaştem” 
solnița undeva pe masă. In fine putem să “controlăm” mişcările mâinii, întâi 
îndreptând-o spre locul unde se află solnita, apoi deschizând palma ca pentru a 
apuca între degete, apoi apucând solnita cu mâna, retrăgând-o pana solnita ajunge 
deasupra farfuriei, întorcând mâna şi scuturând-o atât cât “credem” că ne trebuie 
sare şi făcând apoi toate mişcările în sens invers pentru a depune înapoi solnita pe 
masă de unde am luat-o. Toate aceste acțiuni sunt atât de banale încât le facem 
purtând un dialog cu partenerul de masă despre un subiect care nu are nimic în 
comun cu condimentarea fripturii din fata noastră, reflex, aproape fără sa ne 
concentrăm la ceea ce facem. 

Dar toate ghilimelele din paragraful de mai sus, comportă acte şi stări 
cognitive, care compun un tablou extrem de spectaculos. Dacă ar trebui să-l 
detaliem, am recunoaşte următoarele componente: 

e realitatea, adică noi, masa, solnita, sarea, farfuria, friptura etc., este 
formată din obiecte care sunt independente unele de altele. Acestea se 
supun legilor fizicii, de exemplu ocupă locuri în spaţiu, nu e posibil ca 
două dintre ele să se afle în acelaşi loc în acelaşi moment şi sunt grele, 
adică cad dacă nu sunt sprijinite de un suport. Datorită unui complex de 
împrejurări oarecare, acestea se găsesc toate într-o vecinătate uman 
sesizabilă, la momentul desfăşurării scenei; 

e noi avem plăceri, dorințe, nevoi. Aceste stări de spirit sunt motoarele 
acțiunilor pe care le initiem. Fără ele am adasta, inerti ca nişte legume, ca 
vântul să ne mute şi ploaia să ne ude; 

e noi avem cunostinte despre foarte multe lucruri, printre altele şi despre 
ceea ce este normal să existe şi să se întâmple în realitate. Aceste 
cunoştinţe reprezintă o memorie a lucrurilor văzute, povestite ori citite. De 
exemplu putem găzdui în această memorie relaţii între obiecte care se 
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află în câmpul nostru vizual şi altele care nu se află acolo. Astfel, "ştim” 
că, în mod normal, sarea se află în solnita, mai "ştim” cum arată o solnita, 
adică care e forma ei, şi stim” că sarea e sărată, adică are acel gust care 
dorim să-l completeze pe cel al fripturii. In acelaşi timp cunoaştem 
acțiunea de "a pune sare în mâncare la masă” pentru că am repetat-o de 
atâtea ori până acum. Dacă nu am avea această cunoaştere, încă ar fi 
posibil să ne satisfacem nevoia de sare (deşi autorul nu o recomandă cu 
prea aprinsă căldură cititorilor săi), pentru că, înzestrați cu inteligenţă cum 
ne aflăm, am putea corela anume cunoştinţe pentru a rezolva pentru 
prima oară această problemă, eventual din câteva încercări. Cu alte 
cuvinte o experiență de acest tip, trăită, primită ori descoperită, este 
evocată în memoria noastră ca soluţia la nevoia de a avea friptura sărată; 

e rezultatul va fi construirea unui plan care să particularizeze cunoaşterea 
de natură generală, la detaliile mesei şi aranjării obiectelor aflate în fata 
noastră. In particularizarea planului, crucială este “recunoaşterea” solnitei 
pe masa, deşi este pentru prima oară când vedem această solnita 
anume. Reuşim să identificăm solnita pe masă pentru că ea seamănă 
atât de mult cu forma pe care stim ca ar trebui să o aibă o solnita. Dacă, 
din obscure motive, solnita de pe masa noastră ar avea forma şi 
dimensiunile unei mingi de baschet, e greu de crezut că am reuşi să o 
identificăm; 

e in fine, planul este pus în aplicare, creierul comandă mâinii secvența 
tuturor acelor mişcări şi urmăreşte realizarea lui, controlând permanent 
poziția mâinii cu imaginea primită în ochi. Dacă, după ce am localizat 
solnita pe masă, am încerca să ne ducem la îndeplinire planul cu ochii 
închişi, am avea mari şanse să apucăm în locul solnitei piperul pe care 
să-l scuturăm în paharul cu vin... 


Esentiala în acest scenariu este reprezentarea realității în memoria noastră. 
Fără această reprezentare, nu am recunoaşte situaţia drept una deja întâlnită, nu 
am putea particulariza secvenţa de acţiuni la realităţile locului pentru a construi un 
plan şi prin urmare am rămâne cu friptura nesărată. 

In acest capitol vom trece în revistă câteva tipuri de reprezentări ce se aplică 
sistemelor de IA. 


4.1 Ontologii 


În filosofie, cuvântul „ontologie” desemnează un punct de vedere sistematic 
asupra Existentei. El este împrumutat de IA unde este utilizat cu semnificaţia de 
specificare a unei conceptualizări (Gruber, 1993, Gruber, 2003). Cu alte cuvinte o 
ontologie reprezintă o descriere a conceptelor şi a relaţiilor ce sunt stabilite între 
acestea pentru a servi unui agent sau unei comunități de agenţi. Scopul ontologiei 
este definirea regulilor formale care să permită unei comunităţi de agenţi să 
interpreteze în acelaşi mod un segment al realităţii (deci al existenţei). 
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4. 2 Taxonomii 


Taxonomia este un tip particular de ontologie. Într-o taxonomie, concepte mai 
putin generale sunt definite în funcţie de concepte mai generale, acestea — în functie 
de altele încă mai generale decât ele ş.a.m.d. 

Mulțimea conceptelor este structurată în ierarhii (taxonomii). Relaţia 
taxonomică este una de moştenire de proprietăţi şi se notează ISA (de la is a din 
engleză), AKO (a kind of), SUBSET, MEMBER etc.'* Dacă x ISA y spunem că y 
este părinte pentru x, iar x este fiu al lui y. De asemenea vom spune că orice 
părinte al lui x ca şi orice părinte al unui părinte al lui x este un predecesor pentru 
x, $i recursiv — orice părinte al unui predecesor al lui x este predecesor al lui x. 
Reciproc, un fiu este un descendent, la fel ca şi un fiu al unui fiu şi un fiu al unui 
descendent. 

lată un exemplu de ierarhie, notată grafic ca în Figura 4.1: 
câine ISA mamifer 

pisică ISA mamifer 

mamifer ISA animal 

peşte ISA animal 

animal ISA entitate_vie 

copac ISA entitate_vie 

entitate _vie ISA obiect fizic 

obiect_ fizic ISA entitate fizică 


Datorită tranzitivitatii relaţiilor ISA, din aceste relaţii se pot deduce cel putin 


următoarele: 


entitate_vie 


câine ISA animal 

câine ISA entitate_vie 
câine ISA obiect _ fizic 
câine ISA entitate _ fizică 
pisică ISA animal 


pisică ISA entitate fizică 
mamifer ISA entitate _ vie 


mamifer ISA entitate fizică 
peşte ISA entitate_vie 


peşte ISA entitate _ fizică 

animal ISA obiect _ fizic 

animal ISA entitate fizică 

copac ISA obiect _ fizic 

copac ISA entitate _ fizică 
entitate_vie ISA entitate _ fizică 


Figura 4.1: Un exemplu de taxonomie 


Noţiunea de concept din reţelele semantice este asimilabilă celei de clasă din 
reprezentările orientate obiect. Numele ataşate conceptelor sunt convenţii de notație 
şi nu sunt suficiente pentru a individualiza conceptele între ele. O reprezentare 
semantică satisfăcătoare trebuie să individualizeze conceptele prin descrieri 


'5 Unele sisteme fac deosebire între relaţiile ierarhice aplicate la nivelul conceptelor (numite acolo 


SUBSET) şi cele dintre instanţe şi concepte (numite ISA) (v. de exemplu (Tufiş, Cristea, 1985)). 
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specifice, proprietati caracteristice. Descrierea unui concept este data de relatii de 
natură semantică ataşate acestuia. In reprezentările noastre grafice, relaţiile 
semantice vor fi figurate prin săgeți simple etichetate cu numele lor, in timp de 
relaţiile de natură taxonomică (ISA) vor fi reprezentate prin săgeți îngroşate (ca în 
Figura 1) sau duble, unind conceptele (sau instanţele lor) de ascendentii imediati. 
Într-o astfel de ierarhie, conceptele mai particulare se spune că moştenesc 
proprietățile celor mai generale. Pentru că reprezentările noastre sunt, în esenţă, 
grafuri, adesea ne vom referi la conceptele sau instanţele ce le populează cu 
numele generic de noduri iar relaţiile dintre ele vor fi arcele care unesc nodurile. 

Noţiunea de concept nu poate fi identificată cu mulţimea instanţelor sale pentru 
că un concept este format nu numai din mulţimea instanțelor cunoscute (înregistrate 
la un moment dat) ale acestuia dar şi de oricâte altele (necunoscute dar posibile) ce 
ar putea satisface proprietăţile ataşate lui. De exemplu conceptul de persoană 
fizică este constant indiferent de câte instanţe ale acestuia sunt cunoscute la un 
moment dat. Deci un concept ar putea fi văzut ca reuniunea unei mulţimi de instante 
fizice cu una de instante virtuale, aceasta din urmă — de cardinal neprecizat, 
potential infinit. Multimile (concrete ori virtuale) ale obiectelor asociate conceptelor 
nu sunt neapărat disjuncte. De exemplu conceptul de programator şi cel de 
bărbat se intersectează şi ambele sunt conţinute în cel de om. Într-o reprezentare 
ca mulțimi, situația poate fi redată ca in Figura 4.2a, în timp ce, într-o reprezentare 
comună rețelelor semantice, aceleaşi relaţii sunt redate ca în Figura 4.2b. 


progr amator bărbat (Programator >) 
\ 
om 


Figura 4.2: De la multimi de instante la concepte 


4.3 Paternitate versus monotonie in sisteme ierarhice 


Într-un sistem ierarhic moştenirea proprietăţilor este caracterizată de două 
dimensiuni: 

e paternitatea — cu simplă ori multiplă moştenire. Într-un sistem cu 
simplă moştenire nici un nod nu poate avea mai mult decât un singur 
părinte, pe când într-un sistem cu moştenire multiplă există cel puţin un 
nod care are cel puţin doi părinți; 
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e monotonia — moştenirea proprietăţilor este monotonă daca fiecare 
nod moşteneşte toate proprietăţile părinţilor şi nici o nouă proprietate 
adăugată pe un nivel inferior nu poate contrazice una omonimă ei 
declarată în ierarhie pe un nivel superior. Dimpotrivă, într-un sistem 
nemonoton o proprietate, dacă apare de mai multe ori, este culeasă 
din predecesorul cel mai apropiat. Astfel, în rețeaua din Figura 4.3, 
presupunând că relaţiile taxonomice sunt reprezentate prin săgeți 
îngroşate, proprietăţile — prin arce orizontale subțiri etichetate şi că 
valoarea unei proprietăți este dat de nodul în care ajunge arcul 
respectiv, vom găsi că proprietatea R. a nodurilor Co şi Cı este Ca, nu 
Cs şi nici Co, şi aceeaşi proprietate R, a nodului C2 este Cs, iar nu Co. La 
fel, proprietatea Rz a nodului C, şi Cs este c;, iar nu Co. Daca am cere 
valoarea proprietăţii dată de o cale vidă de relaţii a nodului x ar trebui 
să-l obținem pe x. 

Ri 


R2 


Figura 4.3: O ierarhie nemonotonă 


Cele două coordonate, fiecare având două valori posibile ne dau patru tipuri de 


sisteme. Acestea sunt explicitate în cele ce urmează: 


sistem monoton cu o singură moştenire: fiecare entitate are un singur 
părinte şi orice entitate în ierarhie moşteneşte toate proprietățile părinţilor; 
sistem nemonoton cu o singură moştenire: fiecare entitate are un singur 
părinte şi dacă o proprietate este repetată în mai multe locuri în ierarhie, 
valoarea cea mai de jos este cea care primează; 

sistem monoton cu moştenire multiplă: o entitate poate avea mai multi 
părinţi şi orice entitate în ierarhie moşteneşte toate proprietăţile părinților; 
sistem nemonoton cu moştenire multiplă: o entitate poate avea mai multi 
părinţi şi, dacă o proprietate este repetată în mai multe locuri în ierarhie, 
aceeaşi relaţie poate fi comunicată de mai multi părinți. 
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4.3.1 Soluţii în cazul mostenirilor contradictorii 


Pentru că o reprezentare de tip nemonoton în care se acceptă moştenirea 
multiplă poate genera contradicții sau ambiguitati pe motivul că aceeaşi proprietate 
poate fi moştenită cu valori diferite din doi sau mai multi părinţi distincti, una din 
următoarele soluții poate fi adoptată: 

e să se adopte o regulă de moştenire ortogonala în proiectarea rețelei: 
informaţia este partitionata între nodurile părinţi astfel încât nici o 
proprietate să nu poate fi moştenită de la mai mult decât un singur nod 
părinte; 

e să se stabilească o regulă de prioritate între nodurile ascendenți, astfel 
încât, dacă aceeaşi proprietate apare din mai multe locuri, ordinea dată 
regula de prioritate să fie cea care să indice informaţia moştenită. Astfel, 
în ierarhia de clase a CLOS cât şi a sistemului ELU (Estival, 1990), 
(Russel et al., 1992) este adoptată regula întâi-în-adâncime şi de-la- 
stânga-la-dreapta. In Figura 4-4 “<” trebuie citit ca “este mai prioritar”. 


(A) 
(8) (c) F<D<B<E<C<A 


Figura 4.4: Regula intai-in-adancime, stânga-dreapta în moştenirea proprietăților 


4.4 Rețelele semantice descriptive — sisteme ierarhice nemonotone 


Vom studia în cele ce urmează un sistem ierarhic nemonoton numit rețea 
semantică. Vom lăsă inadins nespecificată coordonata paternitate, ea putând fi, 
după caz, cu simplă ori multiplă moştenire. In acest din urmă caz, vom presupune că 
rezolvarea ambiguitatilor datorate posibilelor mosteniri contradictorii este făcută fie 
printr-o proiectare ortogonală a sistemului astfel încât niciodată aceeaşi proprietate 
să nu poată fi moştenită pe două căi, fie prin încorporarea unui mecanism de 
moştenire cu priorități. 

Din punct de vedere matematic, o reţea semantică este un graf — format din 
noduri (cu semnificația de concepte sau instanțe ale acestora) şi arce (cu 
semnificația de relaţii). Atributul de semantică este dat din motivul că aceste rețele 
descriu cu usurinta proprietăți semantice ale unui univers limitat (numit si univers al 
discursului). Apropierea (măsurată în lungime de căi) dintre concepte şi a instante în 
rețea simulează “apropierea semantică” dintre acestea în lumea pe care o reflectă 
reprezentarea. 


4.4.1 Un exemplu de reprezentare 


Din punctul de vedere al tipurilor de lumi reprezentate, rețelele semantice pot 
fi: descriptive, dacă descriu lumi obiectuale, statice, şi evenimentiale, daca 
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descrierile se referă la lumi dinamice, aşadar în care accentul este pus pe 
evenimente aflate in desfasurare. 

Vom studia in cele ce urmeaza un tip de retea semantica descriptiva in care 
nodurile sunt structurate pe doua niveluri — nivelul conceptual (sau intensional) si 
nivelul referential (sau extensional) (Tufis, Cristea, 1985). Retelele semantice 
evenimentiale vor face obiectul sectiunii 4.5. 

Pentru a da un făgaş aplicativ discuţiei, să considerăm exemplul unui univers 
al discursului format din corpuri geometrice, în care avem corpuri geometrice 
precum cuburi şi cilindri (v. Figura 4.5). 


Cub2 Nea 
Cub1 Cilindru1 


Figura 4.5: Un mini-univers al discursului 


O posibilă reprezentare a acestei lumi sub forma unei taxonomii semantice 
descriptive arată ca în Figura 4.6. 


corp-geometric 


Reţeaua semantică conceptuală 


Reţeaua semantică referentiala 


Figura 4.6: Taxonomia conceptelor care reprezintă lumea din Figura 4.5 


Desigur această reprezentare include unele elemente ce nu aparțin figurii şi 
anume cunoaşterea de ordin general că orice cub este un corp-geometric, că orice 
cilindru este de asemenea un corp geometric si că un corp geometric este un obiect- 
fizic. Dintr-un alt punct de vedere, să convenim că etichetele cu care notăm 
conceptele sunt convenţionale şi, ca atare, vom presupune că ele, în sine, nu 
adăugă semnificaţii suplimentare reprezentării, care ar corespunde, de exemplu, 
unui pragmatism ataşat de noi termenilor lingvistici respectivi. 
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Pentru lumea obiectuala de mai sus putem pune în evidenţă proprietăți ataşate 
conceptelor, precum materialele din care sunt realizate corpurile şi culorile acestora 
(v. Figura 4.7). 


Figura 4.7: Proprietăţi ataşate conceptului obiect-fizic 


Relaţiile semantice ale unui nod aparținând rețelei sunt moştenite de toate 
nodurile (aflate în taxonomie pe niveluri inferioare lui. Din acest motiv, reprezentarea 
din Figura 4.7 pune în evidenţă faptul că orice obiect fizic are o culoare şi este făcut 
dintr-un material. Dacă singurele instanţe ale conceptului culoare reprezentate în 
rețea sunt galben, roşu şi verde, şi singurele instante ale conceptului material sunt 
fier şi lemn, reprezentarea arată că orice obiect fizic din mini-lumea noastră va fi ori 
galben, ori roşu, ori verde şi va fi făcut din lemn sau fier. 

La nivelul extensional, cel al instanţelor, obiectele pot avea, de asemenea, 
proprietăţi ataşate. Proprietăţile sunt implicite, adică moştenite, sau explicite — deci 
notate în rețea prin relaţii. Aşa cum am văzut în secțiunea 4.3.1, atunci când aceste 
relaţii sunt omonime celor de pe nivelurile superioare, semnificaţia este de 
restrângere a valorilor, ori de reprezentare a excepțiilor. Această semantică este 
dacă de o ordine de prioritate a moştenirii relaţiilor semantice în rețea. In 
conformitate cu regula de moştenire a sistemelor nemonotone, relaţiile de jos 
primează asupra celor aflate pe niveluri superioare. 
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ua serhantică conceptuală 


Reţeala semantică referentiala 


e-făcut-din 


e-făcut-din 
are-culoare 
e-făcut-din 


Figura 4.8: Particularizarea proprietăţilor într-o reprezentare nemonotonă 


Astfel, reprezentarea din Figura 4.8 arată nu numai că orice obiect-fizic este 
înzestrat de proprietăţile are-culoare şi e-făcut-din dar că orice cub este de 
culoarea galbenă, cilindrul1 este verde, cubul şi cilindrul sunt făcute din fier, iar 
cubul2 - din lemn. Acest înțeles se datorează faptului că relația semantică are- 
culoare ce părăseşte nodul cub pentru a intepa nodul galben este plasată mai 
jos în ierarhie decât relația omonimă plasată asupra unui nod aflat mai sus decât 
cub în ierarhie — respectiv conceptul obiect-fizic. 


4.4.2 Interogari în reţele semantice 


Reţele semantice trebuie să permită nu numai statuarea unor cunoştinţe din 
universul de discurs supus reprezentării, dar şi recuperarea acestora, indiferent 
daca ele sunt reprezentate explicit sau implicit în rețea. Următoarele tipuri de 
întrebări pot fi adresate rețelelor semantice: 

> care este închiderea tranzitivă a relaţiilor taxonomice ISA ale unui nod din 
rețea? 
> ce valoare este ataşată prin relația semantică R nodului n? 
> care este calea de relaţii semantice ce se poate stabili între două noduri n7 şi 
n2? 
> care este valoarea regăsită prin navigare în reţea în lungul lanţului de relaţii 
R71... Rn, plecând din nodul n? 


- Închiderea tranzitivă a relaţiilor ISA 


Întrebarea este formulată astfel: care sunt toți y astfel încât x ISA+ y 
(prescurtat, ?y*: x ISA+ y). Funcţia findAncestors() apelează funcția 
recursivă findAncestorsRec()! 
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procedure findAncestors (x) 
begin 

findAncestorsRec(x, ©); 
end 


procedure findAncestorsRec(x, ancList) 
begin 
; ancList e un parametru acumulator care memorează toți 
; strămoşii găsiți până în momentul apelului curent. 

if x ISA nil then return anclList; 

listFirstAnc € toţi părinţii lui x; 

while (listFirstAnc) 

{ someAnc © first (listFirstAnc) ; 


ancList €& findAncestorsRec(someAnc, ancList U {someAnc}); 
listFirstAnc € rest (listFirstAnc); 
} 


return ancLlist; 
end 


- Valoarea mostenita a unei relatii 


Întrebarea este formulată astfel: care este y astfel încât x R y (prescurtat, 
?y: x R y). Următoarea procedură oferă un răspuns printr-o căutare întâi-în- 
adâncime şi de-la-stânga-la-dreapta, ceea ce este în conformitate cu criteriul de 
precedenta enuntat în secțiunea 4.3.1: 


procedure getRelation(x, R) 
begin 
if (x R y) then return y; 
if (x ISA nil) then return nil; 
listFirstAnc € toţi părinţii direcţi ai lui x ordonati conform 
conventiei de prioritate; 
while (listFirstAnc) 

{ someAnc © first (listFirstAnc) ; 
someVal € getRelation(someAnc, R); 
if someVal # nil return someVal; 
listFirstAnc © rest (listFirstAnc) ; 

} 

return nil; 
end 


- Găsirea căii de relații semantice distribuite în ierarhia ascendentă a unui nod 
care îl uneşte cu un alt nod 


Întrebarea este formulată astfel: fiind date nodurile x şi y aparţinând reţelei, 
care este calea de relaţii R.,...,R, plasată cel mai jos în ierarhie, astfel încât x 
ISA*eReISA*e..elSA*eR,. y (pe scurt, ?R*: x ISA*eReISAre..elSA*eR, y)? 
Întrebarea urmăreşte găsirea celei mai scurte căi de relaţii semantice, plasate cel 
mai jos în ierarhie, care, eventual împreună cu relaţii taxonomice, să formeze o cale 
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de la un nod sursa la un nod destinatie. Aceasta cale precizeaza o anume 
proprietate a obiectului sursă, inferabila în virtutea comportamentului specific 
rețelelor semantice de moştenire a proprietăţilor. De exemplu, pentru situația 
schitata în Figura 4.3 o interogare de genul: care este calea de relații R* astfel încât 
Co R* Co, trebuie să producă soluția: R1°R2°R;, pentru că, în sensul definiţiei 
moştenirii (din secţiunea 4.3.1), nici o altă combinaţie de relaţii nu „duce” din Co în 
Co. Într-adevăr, să presupunem că soluţia ar fi fost calea formată din singura relaţie 
Ri (ce poate fi culeasă printr-o navigare în rețea plecând din Co în lungul a trei relații 
ISA şi a unei relaţii R.). Valoarea recuperată a acestei relatii/proprietate a nodului Co 
este nodul C„. Dacă soluţia ar fi fost R:eR2 (de exemplu, pe motivul culegerii ei printr- 
o navigare în rețea plecând din Co în lungul a două relaţii ISA, unei relaţii Ri, unei 
relaţii SA şi unei relaţii R2) nodul regăsit ar fi de fapt c,**. 

Există mai multe posibilităţi de regăsire a acestei căi: căutare înainte, căutare 
înapoi ori bidirectionala. Următoarea procedură efectuează o căutare înainte: 


procedure findPath(x, y) 

begin 
findPathRec ({<x,@>},y); 

; Procedura recursiva findPathRec() primeste doi parametri: 

; — o structură de coadă in care fiecare intrare este o perech 

; formată dintr-un nod (în care s-a ajuns cu căutarea) şi o cale 

; de relații de la nodul de start până la el: <x,pathRel>; 

; — nodul destinație. 

; Structura de coadă este necesară pentru o abordare a căutării 

; întâi-în-lărgime, ceea ce asigură calea de adâncime minimă 

; în termeni de relații taxonomice accesate. 

end 


procedure findPathRec(queue, y) 
begin 
if (null (queue)) then return FAIL; 
<x,pathRel> <- out (queue); 
if x = y then return pathRel; 
listRel <- mulţimea relațiilor semantice definite pe x; 


newEntries <- ©; 
; newEntries va fi lista de intrări contribuita de nodul curent x 
while (listRel) 
{ R <- first (listRel); 
listRel <- cdr(listRel); 
Ze a X R Zy 


newEntries <- newEntries U {<z, pathRel e R>}; 
} 


listParents <- ?z*: x ISA+ z; 


14 Să observăm că în virtutea proprietății de moştenire, o cale de relații de lungime zero trebuie să 


ne lase strict în nodul de plecare, iar nu gi în oricare din nodurile plasate în ierarhie deasupra 
nodului de plecare. Intr-adevar, daca ar fi altfel, atunci mulțimea destinație a căii de lungime zero 
ar trebui să fie {C0, C1, C2, C3} ceea ce ar face ca destinația unei căi de lungime 1, să zicem R1, 
aplicată nodului de plecare C3 să fie mulțimea {C4, C5, C9}, iar nu strict C4. 
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; căutarea trebuie să continue însă si în nodurile părinţi ale 
PPX; 
while (listParents) 
(n <- first(listParents); 
listParents <- cdr(listParents); 
newEntries <- append(newEntries ,{<n, pathRel>}); 
; calea de la nodul start până la oricare din părinții lui x este 
; aceeaşi cu calea de la nodul start până la x 
} 
return findPathRec(in(queue, newEntries),y); 
; În apelul recursiv coada apare incrementată cu noile intrări. 
end 


- Găsirea unei valori prin navigare pe o cale de relații 


Întrebarea este formulată astfel: plecând de la nod x să se găsească nodul y la 
care se poate ajunge (prin moştenire) în lungul căii de relații 
ISA*eReISA*e. . .eTSA*eR, (pe scurt, ?y:x ISA*eReISAre..eISA*eR, y)? 


procedure getValueOnPath(x, listRel) 
begin 
getValueOnPathRec ((<x, listRel>})j; 
; Procedura recursivă getValueOnPathRec() primeşte o structură de 
; coadă în care fiecare intrare din este o pereche formată 
; dintr-un nod (în care s-a ajuns cu căutarea) şi calea 
; de relații care au mai rămas de parcurs; 
; Structura de coadă este necesară pentru o abordare a căutării 


; întâi-în-lărgime, ceea ce asigură respectarea condiției 
; de moştenire a proprietăților. 
end 


procedure getValueOnPathRec (queue) 
begin 
if null(queue) then return FAIL; 
<x,pathRel> <- out (queue); 
if null(pathRel) then return x; 
R <- car(pathRel); 
listRel <- mulțimea relațiilor semantice definite pe x; 


newEntries <- Ø; 
if Re listRel then 
{ y <- ?y: x R y; 
newEntries <- newEntries U {<y, cdr(pathRel)>}; 
} 
listParents <- ?y*: x ISA+ y; 
; căutarea trebuie să continue însă si din nodurile părinți ale 
z a ce) 
while (listParents) 
(n <- first(listParents); 
listParents <- cdr(listParents); 
newEntries <- append(newEntries, {<n, pathRel>}); 
; calea de la nodul start până la oricare din părinții lui x este 
; aceeaşi cu calea de la nodul start până la x 


) 
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getValueOnPathRec(in(queue, newEntries)); 
; In apelul recursiv coada apare incrementată cu noile intrări. 
end 


- Căutare combinată în rețeaua conceptuală şi referentiala 


Acest tip de interogare urmăreşte regăsirea instanţei unui concept plecând 
dintr-o altă instanţă. Pentru aceasta se urcă întâi în reteaua conceptuală din instanța 
dată, se determină calea care uneşte părintele conceptual găsit cu conceptul 
destinaţie şi se coboară din nou în rețeaua referentiala pentru a se determina 
instanța aflată în capătul căii de relaţii care au acelaşi nume cu cele găsite în 
rețeaua conceptuală, plecând din instanţa dată. Astfel dacă x este instanţa dată şi C 
conceptul al cărei instanţă se doreşte a se afla, răspunsul este dat de următorul lant 
de trei interogări: 


?C,: x ISA C, (se cere părintele conceptual al instanței x) 

?R*: C, R* C (se cere calea de relații in reţeaua conceptuală 
care uneşte părintele lui x de conceptul destinație C) 

?y: x R* y (răspunsul la întrebare este dat de instanţa care se 
află în capătul căii omonime de relații, plecând din x) 


Să urmărim pe Figura 4.9 răspunsul rețelei la întrebarea: Care este densitatea 
corpului Cub2? 


? Coup2? Cub2 ISA Ceup2 > Ccup2 = cub 
?R*: cub R* densitate YD R* = e-făcut-din ® are-dens 


?y: Cub2 e-făcut-din e are-dens y > y = 0.8 


4.4.3 Demoni 


Demonii sunt proceduri care nu se apeleaza ci se activeaza singure cand 
anumite condiţii pe care ei sunt pregătiţi să le sesizeze sunt îndeplinite. Cu alte 
cuvinte, un demon este întotdeauna gata să-şi ofere serviciile, atunci când cineva 
are nevoie de ele. Un demon poate fi într-una din stările: adormit, disponibil (idle) 
sau activ. 

Când e adormit, demonul nu este la curent asupra modificărilor ce se petrec în 
lume. Când e disponibil el supraveghează schimbările ce apar şi este sensibil la ele, 
putând să decidă dacă lumea s-a schimbat în aşa fel încât serviciile pe care poate el 
să le pună la dispoziție devin utile. Când este activ demonul lucrează, depune 
rezultatul în lume, modificând-o, după care revine iar în starea disponibil. Doar un alt 
proces poate să decidă când un demon disponibil trebuie să adoarmă şi când un 
demon adormit trebuie trezit, pentru a deveni disponibil. 

Ca exemplu de utilizare a demonilor în reţele semantice, sa ne imaginăm că in 
rețeaua pe care am proiectat-o deja ne interesează să ştim şi masa corpurilor. 
Putem înscrie în rețea aceste informaţii în două moduri: cântărind corpurile şi 
ataşând valorile maselor în nodurile instanță respective, ori construind un demon 
care devine activ numai când această informaţie lipseşte şi care e capabil să deducă 
masa prin calcul utilizând formula: m=p* v. Această din urmă variantă presupune 
interogarea reţelei pentru aflarea densităţii şi a volumului corpurilor. În exemplul 
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nostru, procedura de calcul a masei, realizata ca un demon, este atasata nodului 
conceptual obiect-fizic, prin intermediul fatetei demon a proprietăţii are-masă. 
În aceeaşi manieră se pot ataşa proceduri-demoni de calcul a volumelor diferitelor 
corpuri geometrice. În 

Figura 4.9 acest lucru s-a realizat prin ataşarea fatetelor demon proprietăţilor are- 
vol ale nodurile cilindru şi cub. 

Pentru a înțelege felul în care un demon preia singur o sarcină spre rezolvare 
când e disponibil, să vedem mai întâi care e maniera uzuală în care are loc 
interogarea rețelei, urmărind reprezentarea din Figura 4.9. Astfel, instanţei Cub1 îi 
este ataşată masa în mod explicit, prin relaţia are-masă indicând valoarea 2.500 g. 
Pentru instanța Cub2 nu se cunoaşte masa direct, dar ea poate fi calculată din faptul 
că se ştie că materialul din care e făcut este lemnul şi se cunoaşte volumul acestui 
corp (1.000 cm). În sfârşit, pentru cilindrul nu se cunoaşte nici masa şi nici 
volumul, dar se ştie că e un cilindru făcut din fier, că raza bazei este de 3 cm, iar 
înălțimea de 10 cm. 

Procedurile de tip demon amintite mai sus sunt: 


procedure ComputeMass (x) 

begin 

; află densitatea lui x: 
26s. x ISA Cy 
?Rı*: Cy Rı* densitate 
?yı: X Rı* yi 

; află volumul lui x: 
?Ro*: Cy, R>* volum 
?y2: X RÆ y2 

; calculează masa ca densitate * volum: 
return yı * yo; 

end 


procedure ComputeVolCube (x) 
begin 
; află latura lui x: 
?y: x are-laturd y 
; calculează volumul: 
return y * y * y; 
end 


procedure ComputeVolCylinder (x) 
begin 
; află raza bazei lui x: 
?r: x are-rază r 
; află înălțimea lui x: 
?h: x are-inaltime h 
; calculează volumul: 
return 3.14 * r*r* h; 
end 


Pentru a exemplifica intervenția demonilor, să încercăm să răspundem la 
întrebarea: Ce masă are cilindrul 1?: 
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?y: Cilindrul ISA y > y = cilindru 
?R*, cilindru R* masă  R* = are-masă 
?y, Cilindrul are-masă y > nil 

> demon: ComputeMass (Cilindrul) 


> °?C,: Cilindrul ISA Cc, » C, = cilindru 
> ?Rı*: cilindru Rı* densitate > facut-din e are-dens 
> ?yi: Cilindrul e-făcut-din e are-dens yı > 2.4 
> ?Ro*: cilindru R2* volum ® R2* = are-vol 
> ?y: Cilindrul are-vol y; ® nil 

> demon: ComputeVolCylinder (Cilindrul) 

© ?r: Cilindrul are-rază r > r= 3 
?h: Cilindrul are-indltime h > h = 10 
€ 282.6 
€ 678.24 
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computeVolCylinder 
computeVolCube are-vol 
(demon) 


are-masa 
are-vol are-masa (demon) 
(demon) 
e-facut- 
obiect-fizic 
volum 


are-vol 


= corpgeometric 


are- 
4 are-rază 
R- SS 


FĂ are-latură 
făcut-din 
Reţea semantică referentiala 
are-vol <> 
C o făcut-din 
— ma facut-din 


are-raza 


Retea semantica conceptuala 


Figura 4.9: Demonii reprezentati ca noduri procedurale in retele semantice 


Având la bază mecanismul descris in această secțiune, în anii '80 a fost 
construit sistemul IURES'® (Tufis&Cristea, 1985), (Tufis et al., 1989), care era 
capabil să răspundă la întrebări adresate de un utilizator în limba română. Aplicațiile 
dezvoltate cu IURES au vizat baza de date naţională de programe, o bază de date 
geografice etc. 


4.4.4 Ambiguitati în reprezentarea prin rețele semantice 


Se cunoaşte că rețelele semantice prezintă anumite slăbiciuni în modelarea 
lumilor statice de genul celor prezentate mai sus (Sowa, 1999). Asifel, dacă, 
ignorând anumite detalii, o relație generală precum "tatăl unei persoane este şi ea o 
persoană” se reprezintă ca în Figura 4.10a, în care, conform convențiilor de mai sus, 


= Înţeleg Uşor Româneşte Eliminând Sintaxa (/ Understand and Reply Eliminating Syntax) 
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săgeata plină semnifică o relaţie ISA iar cea subţire — o relaţie semantică. În aceste 
condiţii să vedem cum putem reprezenta o afirmaţie precum "tată! unei persoane o 
iubeşte pe mama acelei persoane”?. 


persoană persoană 


a. b. 


Figura 4.10: Reprezentari pentru a. “tatăl unei persoane este persoană” 
b. “tatăl o iubeşte pe mama” 


O reprezentare precum cea din Figura 4.10b poate fi defectuoasă într-o 
interpretare în care relaţiile de la acest nivel sunt înţelese ca fiind moştenite între 
conceptele ori instanțele aflate pe niveluri ierarhic inferioare. Intr-adevăr, 
presupunând că lon este un tată iar Maria o mamă, adică o situaţie ca cea din 
Figura 4.11, nu am vrea să tragem concluzia ca lon o iubeşte pe Maria, decât în 
cazul în care ei ar fi tatăl, respectiv mama, unei aceleiaşi persoane. In (Thomason, 
Touretzky, 1991) se prezintă un sistem formal de reprezentare prin reţele semantice 
care evita ambiguitati de genul celor puse în evidenţă în exemplul care urmează. 


persoană 


Figura 4.11: Necazuri cu reprezentarea din Figura 4.10b 


O altă posibilitate ar fi insotirea relațiilor de condiţii ce ar trebui să fie verificate 
asupra oricărei perechi de instante care particularizează conceptele unite de relaţie. 
De exemplu, în cazul acestui exemplu, condiţia ataşată relației iubeşte ar trebui să 
fie: 


iubeşte (x,y) <= da, ISA(a,persoană) A are-tată(a,x) A are-mamă (a, y) 


4.5 Reţele semantice evenimentiale. Inferente 


Când utilizăm limbajul pentru comunicare, realizăm continuu inferente. Le 
facem fără nici un efort aparent; ele rezultă direct din inlantuirea logică a 
evenimentelor comunicate, din experiența de viata pe care am acumulat-o şi din 
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cunoaşterea sensurilor cuvintelor. Să încercăm să găsim o explicaţie pentru care 
următoarele două propoziţii citite ori auzite în secvenţă au sens: 


1. Maria a scăpat oul din mână. 
2. Ea a trebuit să curețe apoi pardoseala. 


În efortul de a înţelege acest text efectuăm un dublu lant de inferente: unul pleacă 
dinspre prima frază: 


Maria scapă oul din mână > când nu mai este susţinut de mână oul cade > în 
cădere oul atinge la un moment dat pardoseala > la atingerea pardoselii, oul 
se sparge > prin spargere, oul îşi varsă conţinutul pe pardoseală > conţinutul 
lichid al oului se află pe pardoseală > conţinutul oului pe pardoseală e 
perceput de Maria ca o murdărie 


iar al doilea lant de inferente are ca origine cea de a doua frază: 


Ea = Maria trebuie să curețe pardoseala > Maria gândeşte ca se impune 
curățarea pardoselii > Maria percepe pardoseala ca fiind murdară 


În felul acesta găsim un fapt folosit în comun de cele două lanţuri inferentiale: faptul 
că Maria gândeşte că pardoseala este murdară, ceea ce explică textul şi prin 
aceasta îl face coerent. 

Alte inferente însoțesc de asemenea acest text: înainte de a fi scăpat, oul era 
ținut în mână de Maria; Maria nu a avut intenţia să scape oul; Maria este necajita ca 
a pierdut un ou şi că a făcut un efort ca să facă iar pardoseala curată. Gândim toate 
aceste lucruri fără a le folosi în vreun fel, cu excepţia cazului în care suntem obligaţi 
de apariţia altor exprimări ce ni le solicită pentru a fi, la rândul lor, înţelese. 

De exemplu, dacă prima fraza a exemplului dat mai sus, ar fi urmată de: 


2a. Ea punea ouăle pe care tocmai le cumpărase din sacoşă în frigider. 
atunci fraza 2a, ca sa fie înțeleasă, trebuie să fie însoţită de următoarele inferente: 


1: Maria scapă oul din mână > dacă scap din mână un ou, anterior trebuie să-l 
fi ținut în mână 


2a: Ea = Maria transferă ouă din sacoşă în frigider > Maria ia unul sau mai 
multe ouă în mână si îl (le) depune în frigider > dacă iau in mână un ou 
înseamnă că ţin în mână oul un timp 


Din nou două lanţuri inferentiale se unesc într-un fapt comun: Maria tine un ou 
în mână. Acest fapt contribuie la înțelegerea lui 2a în contextul în care 1 fusese 
pronunţat. 

Cum putem simula aceste procese de inferenta? 


132 


Cristea, Ionita, Pistol — Inteligența Artificială 


4.5.1 Evenimente aflate în corelație logică 


Implicatia logică (entailment, în engleză) reprezintă o componentă inferentiala 
esenţială. Evenimentele aflate în relaţie de implicatie logică sunt fie simultane, fie în 
secvenţă unul fata de altul (cel obţinut, inferat, este anterior celui presupus) (v. 
Figura 4.12). 


axa timpului Figura 4.12: Poziționarea în timp a 
ON evenimentelor aflate în implicatie logică 


Exemple de implicaţii logice: 
- daca scap un obiect din mână înseamnă că anterior tineam acel obiect în 
mână; 
- daca sforăi înseamnă că dorm; 
- daca iese fum înseamnă că undeva arde ceva; 
- daca îmi cer scuze pentru un lucru înseamnă ca admit că am făcut acel lucru; 
- daca sunt aşezat înseamnă că anterior m-am aşezat. 


Relaţia de implicatie logică nu trebuie confundată cu relația de cauzalitate 
între evenimente. In general evenimentele cauză preced temporal pe cele efect: 
(Figura 4.13). 


Pa i il aul Figura 4.13: Poziționarea în timp a 
——— eo od evenimentelor implicate în relaţie cauzala 


- dacă plouă rezultă că pământul va fi ud; 

- dacă mă asez înseamnă că în foarte scurt timp voi fi aşezat; 

- dacă vopsescun obiect înseamnă că obiectul va avea o altă culoare; 
- daca scap un obiect din mână atunci acel obiect cade. 


y Există o diferența dintre cauzalitatea din natura şi reflectarea ei cognitivă. 
Intrucat abordarea noastră este una legată de interpretarea textelor, in acest studiu 
nu ne interesează să modelam realitatea ci doar maniera în care reflectam realitatea 
în procesul lecturii. Ce am dat mai sus sunt câteva reguli cauzale “de bun simț’ 
(common-sense) şi ele pot neglija unele aspecte legate de fizică. Aşa bunăoară, 
căderea corpurilor presupune un câmp gravitational de care ţinem seama implicit în 
reprezentările noastre. Dacă însă ne-am plasa într-un mediu în care acesta ar lipsi, 
am avea nevoie de un timp în care reprezentările noastre mintale să sufere corectii 
prin confruntare cu experienţele ce contrazic reprezentările. După un timp vom fi 
înlocuit aceste reprezentări cu altele. De exemplu: 


- dacă scapun obiect din mână atunci acel obiect rămâne lângă mână 


Al treilea tip de relație logică între evenimente este aceea de plauzibilitate 
(plausibility): 


- daca un obiect cade este plauzibil ca un obstacol să oprească căderea la un 
moment dat; 
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- daca un ou este lovit de un anumit obiect dur este plauzibil ca oul sa se 
sparga; 

- daca vorbesc este plauzibil că cineva ma ascultă; 

- daca cineva doarme este plauzibil ca el să sforăie. 


Relaţia de plauzibilitate este una abductivă: ea reprezintă o inversare a relaţiei 
de implicatie logică. Pentru a o explica, cineva a formulat următoarea analogie: 
imaginati-va că sunteţi în casă şi priviţi pe fereastră ramurile unui pom aflat în 
grădină. Dacă cineva scutură pomul veţi vedea ramurile lui tremurând. Avem de-a 
face cu o implicaţie logică. Acum să presupunem că vedem ramurile pomului 
tremurând. Dacă presupunem că acest lucru are loc pentru că cineva scutură pomul 
spunem că am făcut o abductie. Concluzia nu este sigură, ci doar probabilă, pentru 
că ramurile pomului pot să tremure şi din cauză că le scutură vântul, de exemplu. 
Relaţia de plauzibilitate este mai mult una de analogie. De multe ori la aflarea unui 
eveniment ne trec prin minte cauze probabile ale lui. Nu toate inferentele de acest 
tip sunt la fel de probabile. De exemplu, între cele de mai sus, ultima este cel mai 
puţin probabilă. 

Din punct de vedere al dispunerii în timp, evenimentul plauzibil inferat poate fi 
plasat simultan, anterior sau posterior celui presupus (Figura 4.14). 


Figura 4.14: Poziționarea în timp a 
axa timpul , ean x il PR 
NY : f sak evenimentelor implicate in relatie de plauzibilitate 


Revenind asupra exemplului de mai sus detaliem urmatoarele inferente: 


Maria scapă oul din mână CAUSE oul cade >PLAUSIBLE- oul se 
loveşte de un obiect >PLAUSIBLE~ oul se sparge CAUSE conţinutul 
oului se varsă -PLAUSIBLE~> conţinutul oului ajunge pe obiect 
>PLAUSIBLE~ Maria percepe conţinutul oului pe obiect >PLAUSIBLE> 
Maria gândeşte conţinutul oului pe obiect ca o murdărire a obiectului 
> PLAUSIBLE-> Maria este afectată negativ de acest gând... 


Alte inferente sunt de asemenea posibile, dar nu le detaliem aici. 
4.5.2 Un model inferential 


În cele ce urmează propunem un model de dezvoltare a inferentelor în rețele 
semantice, model capabil să dea o explicaţie înţelegerii textelor. Ne interesează 
procesele semantice, deci vom ignora orice tratament sintactic aplicat textului. 
Modelul presupune existenţa unei memorii de lungă durată ce conţine reprezentări 
ale cadrelor evenimentiale ale diferitelor sensuri ale verbelor. Sensurile verbelor, 
substantivelor, adjectivelor şi adverbelor sunt totodată individualizate în ierarhii 
conceptuale în maniera WordNet (Fellbaum, 1998). 

Modelul simulează conştientizarea “citirii printre rânduri”, a “subintelegerii” 
lanțului de evenimente care leagă două situaţii ori evenimente redate de text, 
utilizând o memorie de scurtă durată. Această memorie este organizată ca o rețea 
semantică, fiind populată cu noduri evenimentiale, instante ale verbelor-concepte 
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predefinite in memoria de lunga durata. Evenimentele raman in aceasta memorie 
atat cat e nevoie pentru “prinderea” intelesului, adica realizarea unui lant inferential 
capabil să găsească legătura dintre două fraze ce apar consecutiv în discurs. Odată 
realizat acest lucru, memoria de scurtă durată este eliberată de nodurile ce au 
contribuit la acest proces, însă anumite rezultate ce sunt considerate “importante” 
pot fi eventual transferate în memoria de lungă durată. 

Un pas inferential poate să aibă loc fie direct, prin parcurgerea unei relaţii 
implicationale, cauzale ori plauzibile plecând dintr-un eveniment realizat, fie indirect, 
parcurgând mai întâi prin moştenire unul sau mai multe niveluri ierarhice din 
reprezentarea statică a unui tip de eveniment şi efectuând apoi o implicatie logică, 
cauzală ori plauzibilă. 

In cele ce urmează vom detalia acest proces pentru simularea “înțelegerii” 
exprimării din exemplul prezentat mai sus. Intâi câteva reguli inferentiale: 


RC_scăpa (regulă cauzală cu a scăpa): ori de câte ori o persoană scapă un 
obiect, obiectul va cădea (v. Figura 4.15). Desi, definirea rolurilor de AG (agent — cel 
mare face acţiunea), REC (receptor — cel asupra căruia se răsfrânge acţiunea), OB 
(obiectul angrenat în acţiune), este până la urmă o chestiune de convenţie, atâta 
vreme cât nu există reguli specifice general aplicabile unor anumite roluri semantice, 
vom conveni să considerăm ca participând în postură de AG entităţile care sunt 
activ implicat într-o acţiune sau o situaţie, în postură de REC — pe cele implicate 
pasiv, iar în postură de OB — pe cele care intermediază realizarea evenimentului. 
Din acest punct de vedere, persoana care scapă obiectul este un activ si deci joacă 
rolul de AG, obiectul scăpat este un pasiv, asupra lui manifestându-se acțiunea de 
scăpare, deci este un REC. 


Pa 
persoană 


a cădea 


Figura 4.15: O regulă cauzală cu a scăpa 


RP_cădea (regulă plauzibilă cu a cădea): dacă un obiect cade este plauzibil ca 
după un timp el să atingă repede un obstacol — care este un obiect (v. Figura 4.16). 


REC 
: REC plausible 
(X-obiect Cacia 
a Ae a 
MOD 


Figura 4.16: O regulă plauzibilă cu a cădea 
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RP_lovi1 (regulă plauzibilă cu a /ovi): daca un obiect fragil loveşte un alt obiect 
dur este plauzibil ca obiectul fragil să se spargă (Figura 4.17). 


a, 


TR 


REC 
plausible 
= + Ge sarae) 
ee 


Figura 4.17: O regulă plauzibilă cu a lovi 


Urmând a ne sluji de ea mai târziu, să mai adăugăm în acest punct o regulă 
plauzibilă cu a lovi, de data acesta în care agentul este un lichid. 


RP_lovi2: dacă un lichid loveşte un obiect este plauzibil să credem că lichidul 
va fi întins pe acel obiect (Figura 4.18). 


Figura 4.18: Dacă un lichid loveşte un obiect, 
e plauzibil să inferăm că lichidul va fi întins pe obiect 


RC_sparge (regulă cauzală cu a se sparge): dacă un recipient se sparge şi el 
conţine un lichid, este cauzal adevărat că lichidul se va revărsa din recipient (Figura 
4.19). Să urmărim marcarea recipientului si a lichidului pe roluri REC în 
evenimentele de spargere şi revărsare, ca fiind pasiv implicate în ele. 
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Joorrans REC 


REC cause 
container) a se sparge) ===} 


FROM 


Figura 4.19: O regulă cauzală cu a se sparge 


Vom vedea imediat că aceste reguli de “recunoaştere a realităţii din jurul 
nostru” încă nu sunt suficiente pentru a modela procesul inferential din exemplul 
nostru. Deocamdată să mai adăugăm cunoaşterea că un ou este (şi) un recipient, în 
sensul de ţinător de substanta’®. De asemenea, putem vedea a se revărsa ca un fel 
particular de a cădea în care receptorul acţiunii este un lichid. Dacă adoptăm 
această plasare ierarhică'”, atunci din vărsarea conţinutului rezultă prin regula de 
plauzibilitate RP_cadea că acesta va atinge un obstacol. Inferenta este una 
indirectă şi rezultă din compunerea a doi paşi: unul de moştenire şi celălalt cauzal. 

In continuare vom detalia maniera în care aceste reguli se pot combina pentru 
a forma un lant inferential. 


1. Maria a scăpat oul din mână. 
Prima propoziţie provoacă apariția unui eveniment cu verbul a scăpa (Figura 4.20). 


Apariţia unui eveniment cu a scăpa va amorsa un proces care verifică pattern-urile 
inferentiale (implicationale, cauzale şi plauzibile) ataşate acestui verb. 


Figura 4.20: Evenimentul nou apărut evi 


16 in WordNet 1.6 o astfel de informaţie lipseşte. Un ou e privit numai din punctul de vedere biologic, ca celulă 


ce poate da viata. Informaţia morfologică, ce pune în evidenţă constituția sa de “ținător” de substanță 
vâscoasă, este ignorată. 

Din nou WordNet 1.6 nu clasifică a vărsa (/eak, flow, pour) ca fiind în relaţie de hiponimie cu a cădea (to 
fall). 


17 
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Procesul general este acela in care aparitia unui eveniment al unui verb 
(concept) provoaca aparitia unor evenimente legate prin relatii inferentiale de acel 
verb. Functionarea in acest mod poate fi pusa pe seama unei meta-reguli de forma: 


MRCause 
if isEvent (evı, conc;) and isCauseRule(RC, concu, conc>) and 
verifies(ev,;, RC) then born (evz, conc>) 


Această meta-regulă (meta — pentru ca ea se aplică unei clase întregi de reguli 
cauzale) spune ca dacă apare un eveniment ev:, instanță a unui concept conc; 
(isEvent — este un predicat cu comportament de demon, el verificând existența 
unui eveniment dintr-o clasă data) şi dacă există o regulă cauzala RC în care 
conceptul conc; apare ca initiator şi conceptul concz ca rezultat si daca 
evenimentul ev, verifică restricțiile semantice ale părţii stângi a regulii RC, atunci se 
va crea un eveniment ev», instanță a conceptului conc, împreună cu toate 
legăturile şi obiectele noi implicate de instantierea părţii drepte a regulii RC. 
Meta-regula MRCause poate fi aplicată la apariţia evenimentului ev1 al verbului 
(concept) a scăpa (isEvent (evi, conc;) este instantiat de ev; = evi şi, conc; = 
a scăpa) pentru că există o regulă cauzala a lui a scăpa (isCauseRule (RC, 
conc), conc) este verificată de Rc = RC_ scăpa, conc; = a scăpa, conc>=a 
cădea), şi restricţiile semantice ataşate rolurilor AG şi REC sunt verificate de, 
respectiv, Maria, care este o persoană, şi oull, care este un obiect (adică 
verifies(ev1, RC scăpa) se evaluează la true). Activarea meta-regulii 
MRCause va determina apariția unui nou eveniment, ev2, care trebuie să fie unul al 
verbului a cădea şi în care rolul REC trebuie să fie satisfăcut de aceeaşi entitate 
care satisface rolul REC al evenimentului precedent cu a scăpa, adică oul1 (v. 


Figura 4.21). 


fisa e 


Figura 4.21: Evenimentul nou apărut ev2 


În mod analog pot fi puse în evidență alte două meta-reguli, care descriu 
respectiv inferentele implicationale si pe cele plauzibile: 


MRImplies 
if isEvent (evı, conc,) and islmplyRule (RI, conc;, conc>) and 
verifies(ev., R) then born(ev2, conc>) 


MRPlausible 
if isEvent (evı, conc,) and isPlausibleRule(RP, conc;, conc>) and 
verifies(ev,, R) then born(ev2, conc) 
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Mai departe, aparitia unui eveniment al verbului a cadea, prin efectul meta- 
regulii MRPlausible, atrage declanşarea regulii RP_cadea (v. Figura 4.16). 
Aceasta duce la crearea (cu un anumit grad de incertitudine, datorat naturii 
plauzibile iar nu sigure a el) a unui eveniment al verbului a atinge (v. Figura 4.22). In 
acest fel un obiect (necunoscut deocamdată) este creat. El este notat aici cu X- 


obiect. 
ISA 
rec p Cobiect D 


MOD 


Figura 4.22: Evenimentul nou apărut ev3 al conceptului a atinge 


Până acum trei evenimente noi populează spaţiul inferential al memoriei de 
scurtă durată. Apariţia lor simulează conştientizarea situaţiilor de scăpare din mana 
a oului, de cădere a acestuia cât şi a faptului că, în cădere, acesta atinge un obiect. 
Să observăm că prima propoziţie nu pune în evidenţă obiectul de care se va lovi oul: 
la fel de bine el ar fi putut fi un scaun, colţul mesei sau pălăria unui trecător aflat sub 
balconul pe care s-ar fi putut petrece acest episod... 

Cât de departe trebuie să mergem cu lanţul inferential? Cat de multe inferente 
facem? Oricâte, sau numai câte sunt necesare pentru înțelegerea textului. Există o 
limită rezonabilă unde am putea opri acest lant? Preocupati, în textul de fata, de 
găsirea unui model al înțelegerii în profunzime a textelor, vom ignora deocamdată 
întrebări de acest gen, ce ţin de “gestionarea” procesului inferential’®. Preocuparea 
noastra, deocamdata, este de a arata ca un astfel de lant se poate inchide firesc pe 
un rezultat care include una dintre acceptiunile posibile ale textului. 

Un mod particular de atingere este lovirea. Astfel WordNet 2.1'° raportează un 
sens al lui to hit ca troponim (sens particular) al verbului to touch (invers, to touch 
este considerat un hiperonim al lui to hit): 


touch -- (make physical contact with, come in contact with; 
"Touch the stone for good luck"; "She never touched her 
husband"; "The two buildings almost touch") 

=> strike, hit -- (produce by manipulating keys or strings of 
musical instruments, also metaphorically; "The pianist strikes 


18 Un tip de control poate fi acela în care inferentele se desfăşoară tot timpul, în paralel cu citirea textului. 


Fiecare frază amorsează noi lanțuri inferentiale iar unele lanțuri aflate în desfăşurare se pot închide atunci 
cînd se regăsesc evenimente introduse deja de alte lanțuri. Aceste evenimente, apărute redundant, 
constituie semnale că un înțeles a fost construit. Scoruri de “satisfactie” pot fi imaginate care să dea o 
imagine a gradului de înțelegere a textului. 

Tezaurul lexical Wordnet, construit la Universitatea din Philadelphia, poate fi consultat si download-at la 
adresa http//www.upenn.edu/~wn. 
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a middle C"; "strike *z' on the keyboard"; "her comments struck 
a sour note") 


O maniera generala in care dintr-un concept mai general se poate obtine, prin 
particularizare, unul mai specific, este data de urmatoarea meta-regula: 


MRHypernim 
if isEvent (evı, conc,;) and isHypernimDueToRoles(conc,, concoz, 
Roles) and verifiesRoles(ev;, Roles) then born (ev, conc>) 


care spune că dacă există un eveniment ev, aparținând conceptului conc; şi daca 
conc, este un hiperonim cunoscut al conceptului conc: şi daca particularizarea lui 
conc; În conc, se face prin rolurile Roles cu anumite valori ataşate şi dacă 
evenimentul ev, verifică rolurile Roles, atunci se crează un eveniment ev, al 
conceptului mai particular conc, în care apar de asemenea valorile rolurilor Roles. 
Figura 4.23 arată că rolul care particularizează a atinge în a lovi este MOD cu 
valoarea repede. 

Ca urmare a aplicării metaregulii de hiperonimie, apariția evenimentului ev3 
duce de asemenea la apariția evenimentului ev4, al conceptului a lovi (v. Figura 
4.24). In acest eveniment, un obiect de care oul s-a lovit în cădere este presupus 
(notat în Figura 4.24 cu X-obiect). Incă nu ştim ce poate fi acest obiect. Identitatea 
lui va fi relevată mult mai târziu, în virtutea mentionarii podelei în fraza 2 din 
exemplul nostru. 


Figura 4.24: Avem acum un eveniment cu a lovi 


140 


Cristea, Ionita, Pistol — Inteligența Artificială 


În continuare, în virtutea regulilor RP_lovi şi RC_sparge şi a metaregulilor MR- 
Plausible şi MR_Cause cât şi a cunoaşterii faptului că un ou este un obiect fragil 
de tip container care conţine un lichid, două noi eveniment sunt construite (v. Figura 


4.25). 
ISA ISA 


FROM as 
| REC 
ATR 
——> 
CONTAINS 


Figura 4.25: Conştientizăm spargerea oului (ev5) si revarsarea conținutului său (ev6) 


Pentru a exemplifica maniera în care o regulă de bun simţ se poate aplica de 
mai multe ori, vom face presupunerea că dispunem de cunoaşterea de semantică 
lexicală care clasează verbul a se revărsa ca o formă particulară de cădere, ca în 
Figura 4.26. 


a se revărsa 


Figura 4.26: Dacă un lichid cade înseamnă că el se revarsă 


În virtutea aplicării meta-reguli MRHypernim din nou, existența evenimentului 
ev6 va duce la apariția unui eveniment al verbului a cădea, iar aplicarea recursivă a 
regulii de bun simţ RP_cadea, va da naştere, în aceeaşi manieră ca si mai înainte, 
la un eveniment cu a atinge (v. Figura 4.27). 
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(Y-lichid 


Figura 4.27: Conţinutul oului cade şi atinge (rapid) un obiect 


Să remarcăm că X-obiectul de care se loveşte oul nu este necesar să fie 
acelaşi cu Z-obiectul de care se loveşte lichidul. Mai departe însă, pentru că AG-ul 
evenimentului cu a atinge nu mai este un obiect ci un lichid, regula RP _lovi nu 
poate fi aplicată încă o dată. O altă regulă pragmatică trebuie să funcţioneze, 
capabilă să infereze că dacă un lichid loveşte un obiect, atunci lichidul se întinde pe 
obiect (v. RP_lovi2 şi Figura 4.28). Ca urmare o situaţie în care conţinutul oului este 
întins pe acest obiect pe care l-a atins în cădere va apare în memoria de scurtă 


durată: 
ISA 
— 


Figura 4.28: Continutul oului este întins pe un obiect 


Exemplul poate fi continuat până la atingerea unei stări în care Maria gândeşte 
conținutul oului pe obiect ca o murdarire a obiectului si ea este afectată negativ de 
acest gând. In mod analog, un proces va fi inițiat din fraza a doua a exemplului 
considerat. Cum un proces de curățare este datorat perceperii unei murdării, iar 
necesitatea de a o curăța, unei stări negative insuflată de ea, va exista un moment 
în care cele două lanţuri inferentiale se ating pe o stare comună. Acest fapt comun, 
indus de o frază si presupus de cealaltă, este liantul care face ca exprimarea să fie 
coerentă. Când un astfel de proces se derulează într-o maşină, atunci suntem 
indreptatiti a spune că maşina a ,inteles” exprimarea. 


Cerinţe pentru studenți: 


e Sa fie capabili să producă o reprezentare a cunoaşterii dintr-un univers dat. 

e Să recunoască necesitatea utilizării unei rețele semantice descriptive sau a uneia 
evenimentiale, în funcţie de problema. 

e Să poată adapta ori produce un algoritm care să ofere posibilitatea obţinerii de 
inferente în rețele semantice. 
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Probleme şi proiecte de casă 


P4.1 Care dintre următoarele propoziţii vi se par importante în definirea rețelelor semantice 
(RS), care sunt adevărate şi care false: 
- RS descriu relații dintre obiecte reprezentate prin noduri; 
- nodurile în RS sunt cercuri cu nume; 
- cea mai importantă trăsătură a RS este moştenirea proprietăților; 
- cea mai importantă trăsătură a RS este moştenirea multiplă; 
- ceea ce deosebeşte RS de logica predicatelor de ordinul | (LPOI) este că în RS pot 
exprima Toate păsările zboară cu excepţia pinguinului, pe când în LPOI nu; 
- atât in LPOI cât şi în RS pot deduce din „Orice om e muritor. Socrates este om.” că 
„Socrates este muritor.” 


P4.2 Să se reprezinte prin RS: 
- Un Boeing 747 este un avion. 
- Avioanele si păsările zboară. 
- Un vultur este o pasăre. 
- Avioanele au motoare iar păsările pene. 
- Avioanele au pilot si păsările cioc. 
- Atât avioanele cât si păsările folosesc principii aerodinamice. 


P4.3 Ştiţi următoarele fapte despre lume: 
- cele mai multe ființe nu zboară; 
- cele mai multe păsări, ființe fiind, zboară; 
- pinguinii şi struţii, păsări fiind, nu zboară; 
-  strutii magici însă zboară; 
-  Birco este o pasăre; 
-  Zuicu este fie un pinguin, fie un strut; 
- Crot este un strut magic. 
a). Dati o reprezentare a acestor cunostinte prin retele semantice descriptive. 
b). Aplicând reguli de moştenire nemonotona, raspundeti apoi la întrebările: 
— Birco zboară? 
— dar Zuicu? 
— dar Crot? 
— dar Motu? 


P4.4 Stiti urmatoarele fapte despre lume si numai pe acestea: 

- bicicletele cântă, sunt prevăzute cu spite şi împletesc ciorapi; 

- caii, biciclete fiind, văd dar nu împletesc ciorapi pentru că sunt prevăzuţi cu sei; 

- ochelarii, biciclete fiind, văd dar nu cântă pentru că nu sunt prevăzute cu spite; 

- ochelarii de soare însă nu vad; 

- şi oricine ştie că lucrurile nu văd şi nu pot canta; 

- bicicletele, ca orice din lumea asta, sunt lucruri. 
Să se enunte proprietăţile calului lui Nero, ale bicicletei roşii din holul Facultăţii, ale 
ochelarilor de soare ai domnului decan şi ale Dunării albastre. 


P4.5 Să se reprezinte cu ajutorul reţelelor semantice cunoaşterea din următorul text: 
Aorta este un tip particular de arteră care are un diametru de 2.5 cm. O arteră este un 
vas de sânge, cu perete muscular şi diametrul de 0.4 cm. O venă e un vas de sânge cu 
pereți fibroşi. Vasele de sânge au formă tubulară şi contin sânge. 


P4.6 Informaţii asupra arborelui genealogic al unei familiei sunt descrise ca o reţea 
semantică în care nodurile sunt persoane şi legăturile sunt către părinţi şi (eventual) către fii. 
Pentru orice persoană se cunoaşte sexul. Desenati rețeaua pentru arborele genealogic: 
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Lili si Axinte sunt copiii lui Leana si Costel. Florin si lon sunt fiii lui Lili si Vasile. loana e 
fata lui Maria si Axinte, iar Cornel e fratele său. Pe unchiul lui Cornel îl cheamă Gigel. 

a). Descrieti un mod de reprezentare a rețelei semantice prin liste LISP. 

b). Scrieţi funcţii LISP care să permită aflarea bunicilor şi a verilor unei persoane. 


P4.7 Să se completeze rețeaua semantică relativă la corpuri geometrice dată la curs cu o 
piramidă PIRAM1 făcută din aluminiu (greutate specifică 2.7 g/cm*) şi de volum 50 cm?. Să 
se arate care suni interogările lansate asupra rețelei de un apel al demonului 
computeMass (PIRAM1). 


P4.8 Sa se reprezinte cunostintele din fraza următoare folosind rețele semantice 
evenimentiale: 
Maria crede că lui lon nu fi place să inoate, de aceea nu merge în vacanță la mare. 


P4.9 Citiţi următorul text: 
Maria a văzut un om intrând în casa ei. 
Ea a chemat Poliţia. 
a. Dati o reprezentare prin reţele semantice evenimentiale a acestor două fraze. 
b. Precizati un set de reguli inferentiale care, aplicate în secvenţă, să dea sens acestui text. 


P4.10 Analizati-va reacţiile vis-a-vis de cele două secvenţe de mai jos. Explicati motivele 
acestor reacții. Construiti un sistem capabil să reacționeze la fel ca dv. 
A. Mihai s-a dus la statie să facă plinul 
dar benzinarul i-a spus că nu mai are benzină. 


B. Mihai s-a dus la staţie să facă plinul 
dar benzinarul i-a spus că nu mai are benzină in maşină. 
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Capitolul 5 
Probleme de satisfacere 
a constrângerilor 


Atunci cand nu faci greşeli, nu rezolvi probleme îndeajuns de complexe. Si asta e o 
mare greşeală. 


Frank Wilczek 


5.1 Introducere 


Faptul că satisfacerea constrângerilor s-a configurat actualmente ca un 
domeniu important şi de sine stătător în informatica teoretică şi aplicată este datorat 
multitudinii de situaţii din lumea reală care pun pe tapet probleme ce impun 
respectarea simultană a mai multor cerințe. O listă a domeniilor care abundă în 
astfel de probleme trebuie să includă: planificarea automată, configurarea 
resurselor, design, diagnosticare, rationare temporală şi spaţială etc. 

Satisfacerea constrângerilor este acel subdomeniu al inteligenţei artificiale 
care încearcă determinarea unei soluţii practice cât mai bune dată fiind o listă de 
constrângeri şi priorități. 

Formal, o problemă de satisfacere a constrângerilor (eng.: constraint 
satisfaction problem — CSP) este definită printr-o reţea de constrângeri. O rețea de 
constrângeri constă dintr-o mulţime de variabile X={X;,..., Xn} şi o mulţime de 
constrângeri C=(C,,..., Cd. Fiecare variabilă X; poate lua valori dintr-un domeniu Dj. 
O constrângere C;este o relaţie Aj definită pe o submulțime de variabile şi care 
determina asignări legale de valori. Reţeaua este referită printr-un triplet R=(X, D, 
C). O soluţie pentru o astfel de problemă este o asignare de valori variabilelor astfel 
încât toate constrângerile să fie satisfăcute (Dechter, 2003; Tsang, 1993). 

Ca o observaţie, în definiţie nu se impune nici o condiţie asupra tipului 
variabilelor. Acestea pot fi întregi, logice, mulţimi, sau de orice alt tip. De asemenea, 
nici modul de definire a constrângerilor nu este limitat. Constrângerile pot fi date atât 
explicit, prin specificarea tuplelor de valori permise, cât şi implicit, prin relaţii (ex: X; 
> 2). 

O problemă pentru care există o soluţie se numeşte satisfiabila sau 
consistentă. In caz contrar, ea se numeşte nesatisfiabilă sau inconsistentă. Există 
situaţii în care se doreşte determinarea tuturor soluţiilor, sau doar a uneia sau, în 
caz de inconsistenta, specificarea acestui lucru. In practică, deseori este greu de 
determinat o asignare care să satisfacă toate constrângerile. O extensie a problemei 
CSP este problema Max-CSP în care scopul este găsirea unei asignări cu număr 
minim de constrângeri violate. In cazul în care constrângerile implică cel mult două 
variabile, numim problema CSP-binară. 

O problemă de satisfacere a constrângerilor poate fi reprezentată printr-un 
graf, numit graf constrâns. Pentru fiecare variabilă este asociat un nod, iar un arc 
este trasat între fiecare pereche de variabile conţinute într-o constrângere. 
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Exemplul 5.1: problema reginelor 
Dată fiind o tablă de şah n x n dorim să plasăm n regine pe tablă astfel încât 
nici o regină să nu fie atacată de nici o altă regină. 


O posibilă formulare a problemei reginelor ca o problemă CSP ar fi 
următoarea: pentru fiecare coloană a tablei de şah asociem o variabilă X, iar 
domeniul variabilei sunt liniile, adică D;= (1,.., n). Constrângerile sunt asociate 
fiecărei perechi de coloane şi precizează următorul fapt: două regine nu se pot afla 
pe aceeaşi linie sau pe aceeaşi diagonală, ceea ce se exprimă prin relaţiile: 


XiF# Xi 
[Xi— Xj| # |i-j|, pentru oricare i, j din intervalul 1, ..,n. 


Particularizand la n = 4, se obţine problema celor 4-regine, în care variabilele 
sunt {X7, X2, X3, X4}, fiecare având domeniul (1, 2, 3, 4}. Constrângerile sunt C; = 
Rip, Co= R13, C3 = Ra, Ca = R23, Cs = Roa, si Cs = R34, date, în formă extensională, 
ca în Figura 5.1. 


Xı X2 X3 Xa 


i i R25 101:3), (1,4), 24), (3,1), (4,1), 42) 

R13= {(1,2), 1,4), ( 3 i , ), ( i , a , ( i i 3 )} 
2 EI Rq=10:2), 1,3), (2,1), (2,3), (2,4), (3,1), (3,2), (3,4), 
, (4,2), (4,3) 
4 


Figura 5.1: Problema celor 4-regine ca o problemă de satisfacere a constrângerilor 
Graful constrâns este complet deoarece poziția unei regine pe o coloană 


influențează poziţiile valide ale reginelor pe restul coloanelor. 


Exemplul 5.2: Problema colorării hărţii 
Dată o hartă cu n tari, să se asigneze câte o culoare dintr-o mulțime data 
fiecărei tari, astfel încât țările vecine să aibă culori diferite. 


Asignam fiecarei tari de pe hartă o variabilă care va avea ca domeniu 
mulțimea de culori. Intre două tari vecine în graful constrâns vom adăuga un arc. 
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LT OS 


a) 


Figura 5.2: a) Problema colorării unei hărţi cu 5 tari, culorile posibile fiind roşu, 
albastru şi verde b) Graful constrâns 


Exemplul 5.3: Sudoku 

Cele mai răspândite puzzle-uri Sudoku sunt cele de ordin 3. Un astfel de 
puzzle constă dintr-o tablă de 9 x 9, în care fiecare pătrat poate avea un număr de la 
1 la 9. Data o asignare parțială a tablei, scopul este de a completa poziţiile rămase 
libere astfel încât fiecare număr să apară o singură dată pe o linie, pe o coloană şi 
într-o regiune 3 x 3. 


O posibilă modelare ca o problemă CSP: fiecare poziţie a tablei este 
reprezentată de o variabilă, iar domeniul unei variabile este un număr de la 1 la 9. 
Pentru fiecare linie, coloană şi bloc 3 x 3 vom asocia o constrângere de tip 
alldifferent, care specifică că toate variabilele din constrângere trebuie să aibă valori 
diferite de restul variabilelor. 


Figura 5.3: O tablă Sudoku 


Când există preferinţe între soluţii, acestea pot fi exprimate cu ajutorul unei 
funcţii de cost, numită şi funcție obiectiv. Scopul problemei este de a determina o 
soluţie cu costul cel mai bun sau o aproximare a acesteia. Astfel de probleme se 
numesc probleme de optimizare a constrângerilor (constraint optimization). 

In general problemele de satisfacere a constrângerilor sunt din punct de 
vedere computational intractabile (NP-hard). Tehnicile utilizate în rezolvarea unor 
astfel de probleme se împart în două mari categorii: căutare şi inferenta. Algoritmii 
de căutare traversează spaţiul soluţiilor parțiale construind o instantiere completa 
care satisface toate constrângerile, sau determina inconsistenta problemei. Din 
cadrul acestor tehnici fac parte schemele de backtracking. Algoritmii de inferenta a 
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consistentei modifica la fiecare pas problema pentru a o face mai explicita, prin 
urmare mai usor de rezolvat. Exista algoritmi care combina cele doua metode si 
care dau rezultate mai precise. 


5.2 Backtracking in satisfacerea constrangerilor 


Putem aplica un algoritm de backtracking pentru parcurgerea in adancime 
(DFS) a arborelui de cautare. Ordinea variabilelor poate fi fixata inainte sau poate fi 
determinată la execuţie. Algoritmul menţine de-a lungul execuţiei o mulţime de 
variabile instantiate corect, adică o soluţie parţială pe care o extinde pas cu pas. 
Iniţial, mulţimea este vidă. La fiecare pas se selectează următoarea variabilă din 
ordonare şi se încearcă asignarea variabilei cu o valoare consistentă cu instantierea 
parțială. Dacă este găsită o astfel de valoare, algoritmul continuă procedeul cu 
următoarea variabilă. In caz contrar, algoritmul se întoarce la variabila anterioară şi ii 
asignează o altă valoare consistentă. Dacă domeniul unei variabile devine vid, 
atunci nu există o soluţie care să satisfacă toate constrângerile. 

Algoritmul este descris mai jos. Intrarea algoritmului este reţeaua de 
constrângeri R=(X, D, C). Multimile D; păstrează valori din domeniul D; care nu au 
fost încă examinate pentru instantierea parţială curentă. In cazul în care domeniile 
sunt mulțimi ordonate de întregi nu mai sunt necesare aceste mulțimi, ci doar un 
indicator care să specifice poziția până la care au fost considerate valorile. 


procedure BACKTRACKING (R) 
begin 

Di! — Di; 

while 1<i<n 


{ Xi =- SELECTEAZA-VALOARE () ; 
if Xi = null then i + i-l; (întoarcere) 
else 
{ i e itl; (înaintare) 
Di! < Di; 
) 
) 
if i = 0 then return “problema inconsistentă”; 
else return instantierile variabilelor Xj; 


end 


procedure SELECTEAZA-VALOARE 
begin 
while D;' nu e vid 


7J 
~ 
— 


( selectează aleator o valoare a din Di'; 
Di' - Di' Ma}; 
if asignarea (Xj = a) este consistentă cu (4),..,a;) then 
return a; 


} 
return null; 
end 


Algoritmul are complexitatea timp exponentiala si complexitatea spatiu liniara. 
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Actiunile algoritmului de cautare pot fi descrise de un arbore de cautare. În 
Figura 5.4 este schițat subarborele asociat problemei de colorare a hărţii din 
exemplul 5.2 pentru o asignare parţială. 


Xi 


X2 


Figura 5.4: Subarborele de căutare pentru cazul în care nodul X; este colorat cu 
roşu (R), Xə cu verde (V) si X3cu albastru (A); nodurile întunecate nu reprezintă 
asignări valide 


Îmbunătătirile cunoscute ale algoritmului s-au focalizat pe cele două faze ale 
algoritmului: pasul de înaintare (schemele look-ahead) şi pasul de întoarcere 
(schemele /ook-back). Dintre aceste extensii amintim: 

-  backmarking: reduce numărul de verificări ale consistentei; 

- backjumping: îmbunătăţeşte alegerea variabilei pentru pasul de 

întoarcere; 

-  forward-checking: verifică ca valoarea selectată pentru noua variabilă să 

fie compatibilă cu valorile variabilelor viitoare. 

O altă direcție de îmbunătăţire o constituie euristicile de ordonare a 
variabilelor, statice şi dinamice pentru selectarea variabilei următoare. Există şi 
câteva abordări care “învaţă” prin înregistrarea de constrângeri adiționale de-a 
lungul căutării. Exemplificăm în continuare câteva din aceste tehnici. 


5.2.1 Backjumping 


Unul din dezavantajele algoritmului backtracking este aşa zisul mecanism de 
trashing: aceeaşi situaţie de blocaj (dead-end) poate fi întâlnită de mai ori. O situaţie 
de blocaj apare atunci când nu există o valoare consistentă din domeniul noii 
variabile cu asignarea parţială anterioară. Dacă X; este variabila la care apare 
blocajul, algoritmul de backtracking se va întoarce la variabila anterioară X;-1. Să 
presupunem că nu există nici o constrângere între variabilele X; şi X;.1 şi că există o 
nouă valoare pentru X;./. Acelaşi blocaj va fi întâlnit până când vor fi epuizate toate 
valorile lui X;-7. 

Pentru a reduce astfel de verificări inutile, a fost propusă o noua schemă de 
backtracking numită backjumping (Gaschnig, 1979; Dechter, 1990). Acest algoritm 
se întoarce la variabila care cauzează blocajul. Identificarea unei astfel de variabile 
se bazează pe noţiunea de mulțime conflict. O instantiere consistentă (a;,..., a) este 
o mulțime conflict pentru variabila neinstantiata X (sau (a7, ..., ai) este în conflict cu 
X) dacă nici o valoare din domeniul lui X nu este consistentă cu asignarea (aj,..., a. 
Când se ajunge într-o situaţie de blocaj, este recomandat să ne întoarcem cât mai 
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mult posibil, fara insa a omite posibile solutii. O variabila este responsabila pentru 
situaţia de blocaj (culprit variable) daca instantierea (a7,..., ap) este o mulţime 
conflict minimală, adică indicele b este cel mai mic indice cu proprietatea b < í, 
pentru care ap este în conflict cu X;,. Variabila cauză este sigură şi optimală; sigură 
în sensul că nu poate fi extinsă la o soluţie şi optimală deoarece întorcându-ne la un 
nod dinaintea acesteia riscăm să pierdem soluții. 

Algoritmul backjumping al lui Gaschnig este una din metodele care 
implementează această idee. Pentru a localiza o astfel de variabilă, algoritmul 
utilizează următoarea tehnică de marcare: pentru fiecare variabilă X; este reţinut un 
pointer ultim; la cea mai recentă variabilă pentru care s-a testat consistenţa cu X; şi 
care are o valoare în conflict cu o valoare din domeniul lui X; Pe măsură ce este 
completată asignarea parţială, se înregistrează o serie de informaţii care vor fi 
utilizate pentru a determina variabila ce cauzează blocajul. Dacă pentru asignarea 
(a1,..., ai) există o valoare consistentă atunci ultim; v-a fi egal cu i-1. Când ajungem 
într-o situaţie de blocaj şi asignarea (a....., a) este inconsistenta cu X;,+, algoritmul 
se va întoarce la variabila cauză, Xunim(;+1)- 


procedure BACKJUMPING (R) 
begin 
Di! < Dik 
ultimi — 0; 
while 1<i<n 
{ Xi =- SELECTEAZA-VALOARE () ; 


T 


if Xi = null then i + ultimi; (întoarcere) 
else 
fo SE. ree Cates 
Di! — Di; 


ultimi < 0; 


if i = 0 then return “problema inconsistentă”; 
else return instantierile variabilelor Xj; 
end 


7] 
~ 
— 


procedure SELECTEAZĂ-VALOARE 
begin 
while D;' nu e vid 


{ selectează aleator o valoare a din Dj'; 

Di! — Di! Na); 

consistent . true; 

ke dz 

while k < i & consistent = true 

{ if k > ultim; then ultimi — k; 
if asignarea parțială (a),..,a,,Xi;=a) nu este consistentă 
then 
consistent « false; 

else k - k + 1; 
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if consistent = true then return a; 


} 
return null; 
end 


Ca si la backtracking, parametrul de intrare R este reteaua de constrangeri. 


Exemplul 5.4: consideram problema de 3-colorare al carei graf este dat in figura de 
mai jos. Multimea de culori este: roşu, verde şi albastru. 


V nu mai e verificat de 
[__] \packjumping 


DS 


Figura 5.5: a) graful b) subarborele de căutare 


Mai sus avem subarborele de căutare pentru cazul in care nodul X; este 
colorat cu roşu (R), X2 este colorat cu albastru (A) si X3 cu verde (V). In cazul în care 
nodul Xz este colorat cu roşu, pentru nodul Xs nu mai există nici o valoare 
consistentă cu asignarea partială; suntem deci într-o situație de blocaj. Dacă am fi 
aplicat algoritmul backtracking, ne-am fi întors la variabila X4 şi am fi încercat a-i 
asigna o nouă valoare (albastru), ajungând însă în aceeaşi situație de blocaj. Intre 
X4 şi Xsnu există nici o constrângere. Algoritmul backjumping se întoarce la variabila 
care este cauză a blocajului, în cazul nostru variabila X3. Astfel reducem numărul de 
verificări inutile deoarece nu vom mai testa o porţiune a acestui subgraf. 


O altă variantă de backjumping este algoritmul graph-based backjumping 
care extrage informaţii despre posibile mulțimi de conflicte din graful constrâns. 
Când apare o situaţie de blocaj algoritmul se întoarce la cea mai recentă variabilă 
care este conectată cu variabila curentă în graful constrâns. 


5.2.2 Forward-checking 


În algoritmul backtracking după selectarea variabilei următoare, valoarea 
acesteia va fi aleasă astfel încât sa fie consistentă cu instantierea parţială. Forward- 
checking (Haralick, 1980) verifică ca această valoare să fie compatibilă cu cel puţin 
o valoare din domeniul fiecărei variabile viitoare. Astfel algoritmul instantiaza 
variabila cu o valoare şi apoi elimină valori din domeniul varibilelor viitoare care sunt 
în conflict cu instantierea curentă. Dacă domeniul unei variabile viitoare devine vid, 
algoritmul consideră următoarea valoare posibilă pentru variabila curentă. 

Algoritmul este descris mai jos. Fie X;variabila curentă. Ca şi la backjumping, 
mulțimile D' conțin domeniile reduse. Initial acestea sunt egale cu domeniile 
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originale, şi vor fi modificate în funcția SELECTEAZA-VALOARE. FORWARD- 
CHECKING () (referit ca FC, mai departe) alege variabilei curente o valoare 
consistentă cu variabilele viitoare. 


procedure FORWARD-CHECKING (R) 
begin 
Det — Di, 1SiSn; 
while 1<i<n 
{ selectează pentru Xj; o valoare din domeniu consistentă cu 


cel putin O valoare pentru fiecare din variabilele 
următoare: 
Xi < SELECTEAZA-VALOARE () ; 
if X; = null then 
[e se Dl 
resetează Dk' la valoarea dinaintea ultimei instantieri 
a lui Xj, k>i; 


} 


else i - itl; 


} 


if i = 0 then return “problemă inconsistenta” 
else return instantierile variabilelor Xj; 
end 


procedure SELECTEAZA-VALOARE 
begin 
while D; nu e vid 
{ selecteaza aleator o valoare a din Dj' ; 
Di! < Di! Mea); 
domeniu-vid « false; 
for 1<k<n 
{ for b din Dk' 
if asignarea (air. aj-1,X;=a,X,=b) nu este consistentă 
then Dk' — Dk' \{b}; 
if Dk' este vid (bolcaj) then domeniu-vid < true; 


T] 
~ 
— 


) 


if domeniu-vid = true then 
resetează Dķ' la valoarea dinaintea selectării lui a, 
i<k<n; 
else return a; 
) 
return null; 
end 


Reluarea exemplului 5.1: considerăm problema celor 4 regine, modelată ca în 
Exemplul 5.1, în cazul în care am asignat variabilei X; valoarea 4. La acest pas, 
algoritmul Fc elimină temporar din domeniul variabilei X2 valorile 3 şi 4 deoarece nu 
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sunt consistente cu asignarea parțială (X;=4) (a). Similar pentru domeniile 
variabilelor X3 şi X4. Cazul în care pentru variabila X2 este aleasă valoarea 1 este 
evidenţiat la punctul b) — noi valori pentru varialibele X3 şi X4 sunt restrictionate. 
Singura valoare rămasă pentru variabila X3 este 3. Alegând această valoare, 
domeniul variabilei X devine vid (blocaj). 


X=4, X2=1, X3 
D,=0 


Figura 5.6: execuţia pas-cu-pas a algoritmului FC pentru problema celor 4-regine; a) 
după asignarea variabilei X, b) după asignarea lui Xə c) după asignarea lui X3 


5.3 Inferenta 


Algoritmii de inferenta transformă problema într-una echivalentă, mai explicită 
prin deducerea unor noi constrângeri care vor fi adăugate mulțimii iniţiale. Spre 
exemplu, din constrângerile X=Y şi Y=Z putem deduce o noua constrângere X=Z. 
Cele două probleme sunt echivalente, adică au acelaşi set de solutii, însă utilizând 
cea de-a doua reprezentare putem evita situaţii de blocare pe care le-am fi întâlnit în 
primul caz. Cum problema devine mai restrictivă, spaţiul de căutare se va micşora, 
în consecinţă căutarea va fi mai eficientă. 
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Un algoritm de propagare a constrângerilor garantează ca orice soluție 
parțială poate fi extinsă la o nouă variabilă astfel încât noua asignare să rămână 
consistentă (Mackworth, 1977). Algoritmii de -consistență în general garantează ca 
orice instantiere consistentă a /-1 variabile poate fi extinsă la o instantiere 
consistentă de lungime i. Cel mai cunoscut algoritm de consistenţă este arc- 
consistenţa (sau 2-consistenta). 


5.3.1 Arc-consistenta 


O componentă principală a algoritmului de arc-consistenta o constituie 
procedura pentru verificarea consistentei valorilor din domeniu în raport cu o 
constrângere. Procedura Revise () are ca intrare două variabile X; şi X (indicii lor) 
şi verifică daca pentru fiecare valoare y din D; există cel putin o valoare compatibilă 
cu ea din domeniul D;. Daca nu există o astfel de valoare, atunci o atribuire de tipul 

=y nu este validă. Rezultă că valoarea y poate fi ştearsă din domeniu. 


procedure REVISE (i, ]) 
begin 
for y in Dj 


if nu există o valoare z in Dj a.î. asignarea (Xj=y,Xj>2) 


să fie consistentă: y.2efh; then 
şterge y din Dj; 
end 


Complexitatea procedurii este O(k*), unde k este dimensiunea domeniului. 


Descriem în continuare cea mai simplă variantă de arc-consistenta. 
Algoritmul Arc-Consistenta-1 (Ac-1) aplică procedura Revise tuturor perechilor de 
variabile care participă într-o constrângere până când nu se mai modifică nici un 
domeniu. 


procedure AC-1 (R) 
begin 
repeat 
for perechea {Xi,Xj} care participă într-o constrângere 
{ Revise (i, j); 
Revise (j,i); 
} 


until nici un domeniu nu se mai modifică 
end 


Complexitatea algoritmului Ac-1 este O(enk), unde n este numărul de 
variabile, domeniul este limitat superior de k, iar e numărul de constrângeri binare. 


Exemplul 5.5 Considerăm următoarea problemă de colorare a grafului cu nodurile 


X1, X2, X3. Domeniile de valori ale variabilelor asociate vârfurilor grafului sunt 
D,={R,V,G}, D={R,V}, Ds={V}. Graful constrâns este reprezentat mai jos. 
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Figura 5.7: Problema colorării grafului: noduri X;, X2, X3; domeniile sunt cele din 
interiorul elipselor a) graful constrans intial b) graful dupa aplicarea arc-consistentei 


La examinarea arcului dintre nodurile X; şi X2 nu se modifică domeniul nici 
unei variabile. In cazul arcului (X;,X3) pentru culoarea verde (V) a nodului X; nu 
există o culoare corespondentă diferită de aceasta pentru a satisface constrângerea. 
Astfel valoarea verde va fi eliminată din domeniul variabilei X;. Procedeul continua 
similar prin eliminarea valorii verde pentru variabila X2 la procesarea nodului (X2,X3), 
rezultând graful din Figura 5.7 b). 


Una din îmbunătățirile algoritmului Ac-1 se sprijină pe următoarea 
observaţie: chiar dacă numai un singur arc este modificat la iteratia curentă, Ac-1 
revizuieste toate arcele la iteratia următoare; este mult mai probabil ca un număr mic 
de arce să fie afectate de această modificare. Algoritmul Ac-3 elimină acest 
dezavantaj revizuind doar acele constrângeri care pot fi afectate de modificările de 
la iteratia anterioară. Retinem într-o coadă constrângerile care trebuiesc procesate. 
Iniţial fiecare pereche de variabile care participă într-o constrângere este pusă în 
coadă de două ori (pentru fiecare ordonare a perechii de variabile). La procesarea 
unei perechi ordonate de variabile, aceasta va fi ştearsă din coadă şi va fi adăugată 
din nou în coadă doar dacă domeniul celei de-a doua variabile este modificat în 
urma procesării constrângerilor adiacente. 


procedure AC-3 (R) 
begin 
Q- ø 
for perechea {Xi Xj} care participă într-o constrângere 
| Q.inserează (Xi, Xj); 
Q.inserează (Xj, Xi); 
} 
while Q nu e vidă 
{ O.şterge (Xi, Xj); 
Revise (i, J); 
if Revise (i, j) modifică Dj; then 
Q.inserează(Xķ,Xi), unde i#k, dacă arcul nu există în Q; 


} 


end 


Exemplul 5.6: considerăm problema din Exemplul anterior 5.5. La procesarea 
constrângerii dintre variabilele X; şi X2 domeniile variabilelor rămân neschimbate. 
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Cand verificăm arcul (X7,X3) domeniul variabilei X; se modifică. Adaugam la coadă 
arcul (X2,X7) (arcul (X3,X7) există deja în coadă). Procedeul este repetat până cand 
coada devine vidă. Observăm că dacă am fi utilizat ACc-1 am fi verificat în plus încă 
4 arce corespunzătoare constrângerilor dintre X; şi X3, respectiv X2 şi X3. 


Tabela 5.1:executia algoritmului AC—3 pentru problema de colorare din Exemplul 5.5 


arc Q domenii 

((X1+X2), (X2,X1), (X1+X3), (X3.X1), (X2,X3), D,={R,V,G}, D2=(R,V), Ds={V} 
(X3,X2)} 

(X1,X2) | {(X2,X1), (X1,Xs), (Xs,X1), (X2,X3), (X3,X2)) 

(X2,X1) | {(X1,Xs), (Xa,X1), (X2,X3), (X3,X2)} 

(X1,X3) | {(X3,X1), (X2,X3), (X3,X2), (X2;X1)} D;={R,G}, D2={R,V}, Ds={V} 

(X3,X1) | {(X2,Xs), (Xs,X2), (X2,X1)} 

(X2,X3) | {(Xa,Xe), (X2,X1), (X1,Xe)} D,={R,G}, Do={V}, Da={V} 

(X3,X2) | {(X2,X1), (X1,X2)} 

(X2X1) | {(X1,Xe)} 

(X1,X2) | {} 


Complexitatea algoritmului Ac-3 este O(ek*). Algoritmul de arc-consistenta 
poate fi îmbunătăţit mai mult, ajungându-se la complexitatea minimă de O(ek’). 

Algoritmii care asigură consistenţă locală sunt folosiţi în general ca algoritmi 
de preprocesare, utilizaţi înaintea căutării. Backtracking-ul va fi mai eficient pe 
reprezentări mai explicite, deci cu un grad de consistenţă locală mai mare. Metodele 
folosite în practică combină de obicei inferenta cu căutarea, în ideea îmbunătățirii 
rezultatelor căutării. Trebuie avută însă grijă la cantitatea de inferenta utilizată: este 
bine de obicei să existe un echilibru între efortul depus în propagarea 
constrângerilor şi cel depus în căutare. 


5.3.2 Bucket-Elimination 


Deoarece algoritmii de căutare în mod uzual extind o soluţie parțială pas cu 
pas, inferenta poate fi restricționată la o ordine a variabilelor. Această idee 
corespunde noțiunii de consistenţă directionala. Bucket-elimination (Dechter, 1996) 
este un algoritm din această categorie, mai puţin costisitor. Algoritmul are ca intrare 
o mulțime de relaţii sau constrângeri. Dată o anumită ordonare, algoritmul împarte 
mulțimea de relaţii în submultimi (bucket-uri). Fiecare submulțime este asociată unei 
singure variabile. O relaţie va aparține submultimii corespunzătoare argumentului 
care apare ultimul în ordonare. 

In prima fază a algoritmului fiecare bucket este procesat începând de la 
ultima variabilă către prima. Procesarea variabilei X constă în aplicarea unui 
operator de eliminare de variabile. In urma aplicării unei astfel de proceduri, rezultă 
o noua funcţie definită peste aproape toate variabilele din bucket cu excepţia lui X. 
Această funcţie rezumă efectul variabilei X. Ea este introdusă într-un bucket inferior. 

In cea de-a doua fază, aloritmul construieşte o soluţie asignând o valoare 
fiecărei variabile. Ordinea de asignare este cea considerată iniţial. In acestă etapă 
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sunt consultate relaţiile create în cadrul primei faze. Algoritmul este prezentat mai 
jos. 


procedure BE-MaxCSP (R) 
begin 

1. Initializare: partitioneaza relaţiile in bucket;,...,buckety,, 
unde bucket; conține relațiile care au variabila cea mai îndepărtată 
X;. Fie Si,...,S; scopurile relațiilor din bucket-ul procesat. 


2. Backward: 
for p - n până la 1 
for hi, hz, ..., h; din bucket, 
if bucket, conține o instantiere X,=x, then 
{ asigneaza variabila X, cu valoarea x, pentru fiecare 
relație h; ; 
adaugă relațiile rezultate in bucket-urile 
corespunzătoare; 
) 


else 
; j 
( generează funcţia hP: hP = minx, Do hi ; 
j 
adaugă h, la bucket-ul corespunzător variabilei cu 


indexul cel mai mare din Up; 


) 


3. Forward: asignează valori variabilelor în ordinea considerată 
combinația de funcții din fiecare bucket să fie optimizată; 


w 
m> 


return asignarea optimă şi funcția calculată in  bucket-ul 
corespunzător primei variabile 
end 


Algoritmii de acest tip au avantajul cunoaşterii a-priori a performanţei lor, 
performanţă ce poate fi mărginită de un parametru al grafului, lățimea indusă w*. 
Pentru definirea acestei valori, avem nevoie de următoarele noțiuni. Lăţimea unui 
nod într-un graf ordonat (G, d) este egală cu numărul de părinţi ai nodului. Graful 
indus al unui graf ordonat (G, d) este graful reprezentat prin perechea (G*,d) unde 
G* este obținut prin procesarea nodurilor grafului initial G. Procesarea unui nod 
rezultă în conectarea părintilor acestuia. Lăţimea indusă a grafului ordonat (G,4), 
w*(d) este egală cu lățimea grafului indus (G*,d). Lăţimea indusă a unui graf, w* este 
lățimea indusă minimală peste toate ordonările. 


158 


Cristea, Ionita, Pistol — Inteligența Artificială 


Figura 5.8: graful indus al problemei de 3-colorare din Exemplul 5.4, construit pentru 
a) ordonarea d;=(X4, X2, X3, X1, X5) şi b) ordonarea d2=(Xs, X71, X2, X3, X4); noile arce 
sunt reprezentate prin linii întrerupte (X3Xz4). 


În exemplul de mai sus lățimea indusă a grafului indus (G*,d)) este 3 , iar în 
cel de-al doilea caz, pentru (G*,d»), este 2. 


Complexitatea timp şi spaţiu a algoritmului Bucket-Elimination este 
exponențială în lățimea indusă a grafului de interacțiune a problemei pentru o 
ordonare dată. Valoarea latimii induse poate varia pentru ordonări diferite, ceea ce 
implică complexitati diferite. 


Exemplul 5.7: considerăm aceeaşi problemă de 3-colorare din Exemplul 5.4. Primii 
doi paşi ai algoritmului sunt evidentiati în Figura 5.9, pentru ordonarea dj=(Xz4, X2, 
X3, Xi, X5). 


bucket(Xs): X5#Xo, X5#X3, X5FX1 bucket(Xs): Xs5#Xo, X5#X3, X5#X1 
bucket(X.): X1#Xo, X1#X3 bucket(X.): X1#Xo, X1#X3, Rx1x2x3 
bucket(X3): X3#X4 = bucket(X3): X3#X4, Rx2x3 
bucket(X2): bucket(X2): Rx2x4 

bucket(Xz): bucket(X4): Rx4 


Figura 5.9. pasul de initializare $i pasul Backward ai algoritmului Bucket-Elimination 


În partea stângă avem partitionarea iniţială, iar în dreapta relaţiile dupa 
procesare. Din cele trei constrângeri din bucket-ul 5 rezultă o nouă relaţie între 
variabilele rămase, X;, X2 şi X3, relaţie care este copiată în bucket-ul corespunzător 
variabilei X;. Această relaţie nu mai este binară, ca relaţiile iniţiale, ci conţine trei 
variabile. Similar, din procesarea fiecărui bucket următor rezultă câte o relaţie nouă. 


Principalul dezavantaj al algoritmului Bucket-Elimination este complexitatea 
timp mare dar în special complexitatea spaţiu datorată memorării funcţiilor 
intermediare. Pentru a reduce complexitatea spaţiu se pot utiliza algoritmi de 
aproximare. Puterea acestor algoritmi constă în limitarea dimensiunii şi/sau a 
numărului de funcţii înregistrate. Consistenta locală este un exemplu de inferenta 
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aproximată. Mini-bucket elimination este deasemeni o schemă de aproximare care 
încearcă să elimine dezavantajul amintit prin partitionarea bucket-urilor mari în 
submultimi mai mici (mini-bucket-uri). Această metodă permite un echilibru controlat 
între calitatea aproximării şi complexitatea calculului. 


5.4 Euristici pentru selectarea variabilelor şi a valorilor 


Când încercăm să extindem o soluţie parțială, avem de ales următoarea 
variabilă şi valoarea acesteia. Aceste decizii sunt importante deoarece pot reduce 
din verificările algoritmului de căutare, evitând situaţiile de blocaj. 


5.4.1 Ordonarea variabilelor 


Metodele pentru ordonarea variabilelor se pot împărți în două categorii: 
ordonări statice sau dinamice. Aceste euristici îmbunătăţesc pasul de alegere a 
variabilei următoare în algoritmul backtracking. 

In primul caz, ordinea este specificată înaintea execuției algoritmului de 
căutare şi nu este modificată apoi. Printre cele mai eficiente metode de acest tip 
amintim euristicile Minimum width (MW) şi Maximum cardinality, euristici care 
utilizează informaţii din graful constrâns. MW construieşte o ordine în sens invers, 
de la ultima către prima variabilă, după următorul criteriu: alege variabila cu cele mai 
puţine conexiuni către variabilele care nu au fost încă alese. Euristica Maximum 
cardinality selectează iniţial o variabilă aleatoare şi apoi la fiecare pas alege 
variabila conectată cu o mulțime maximală de variabile deja alese. 

In cazul unei ordonări dinamice, alegerea variabilei următoare depinde de 
starea curentă. Ordonarea dinamică nu se poate aplica pentru toți algoritmii de 
căutare. Spre exemplu, pentru backtracking nu există informaţie suplimentară care 
să poată diferenţia între variabile. In cazul algoritmilor Forward-checking sau Arc- 
consistență, starea curentă include domeniile restrânse ale variabilelor. 
Subproblema care trebuie rezolvată de aceşti algoritmi se modifică după fiecare 
asignare. Astfel o ordonare dinamică, în care următoarea variabilă de asignat este 
selectată pe baza informaţiilor despre starea curentă ar putea conduce la o 
performanţă mai bună a algoritmilor. 

O metodă des întâlnită de alegere a variabilei următoare este selectarea celei 
mai constrânse variabile (euristica Minimum Remaining Values MRV). Altfel spus 
variabila cu domeniul curent cel mai mic urmează a fi asignată la pasul următor. 
Motivul acestei decizii se bazează pe următoarea idee: este mai eficient a elimina 
cât mai multe posibilități cât mai devreme. Variabila selectată minimizează factorul 
de ramificare al nodului curent, adică numărul de direcții posibil de explorat. 


Exemplul 5.8: în cazul problemei de colorare din Figura 5.2, după asignările X;=R şi 
X3=V, domeniul variabilei Xs va conţine o singură valoare, deci ar fi mai avantajos să 
asignam lui Xs culoarea albastru decât să asignăm o valoare variabilelor Xə sau X4 
care au câte două valori în domeniu. 

Există situaţii în care dimensiunea domeniului variabilelor este aceeaşi. În 
multe probleme (de exemplu, problema reginelor) domeniile iniţiale au aceeaşi 
dimensiune. Putem alege în acest caz variabila care constrânge cel mai mult spațiul 
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de cautare, adica constrange cat mai multe variabile neasignate. Justificarea e ca 
încercăm astfel sa reducem factorul de ramificare al nodurilor viitoare. 

Pentru aceeaşi problemă de 3-colorare, toate variabilele au domeniile iniţiale 
egale, contin cele trei culori posibile. Nodurile X;, X3 şi X5 au gradul cel mai mare. La 
primul pas alegem unul din aceste noduri. Similar, după asignarea culorii roşu 
pentru variabila X;, domeniile variabilelor X2, X3 şi X5 sunt egale. Variabilele X3 şi 
Xs au câte două conexiuni către nodurile încă neasignate (X2 are un singur arc). Se 
alege unul din aceste două noduri la pasul următor. Tabelul 5.2 exemplifică paşii 
algoritmului Forward-checking combinat cu cele două euristici de selectare a 
variabilei următoare. 


Tabela 5.2: Execuţia algoritmului Fc pentru problema din Exemplul 5.2 
x; X2 X3 Xa Xs 
domeniile R, A, V |R, A, VIR, A, V IR, A, V R,A,V 
initiale 
după X;=R R A, V A, V R,A,V JA, V 
după X3=V R A, V V R, A A 
după Xs=A R V V R, A A 
după X2=V R V V R, A A 
dupa X4=R R V V R A 


Această combinaţie a fost propusă iniţial pentru problema colorării grafurilor 
(euristica lui Brelaz). Se alege drept nod următor vârful cu cele mai puţine culori 
disponibile, iar în caz de egalitate - vârful adiacent cu cel mai mare număr de noduri 
necolorate. Această euristică furnizează rezultate bune pentru problema colorării. 
Domeniile au initial aceeaşi dimensiune şi constrângerile sunt similare. Euristica 
explorează întâi zonele cele mai dense ale grafului. Astfel sunt şanse mai mari să 
detectăm, încă de la începutul căutării, o clică cu un număr de noduri mai mare 
decât numărul de culori disponibile şi să oprim căutarea, pe motiv că problema e 
inconsistentă. 

Pentru probleme CSP generale, în care aceste condiții nu au loc, există 
metode care dau rezultate mai bune. De exemplu, dacă unele constrângeri sunt mai 
dificil de satisfăcut decât altele, atunci ar fi de preferat să asignăm valori variabilelor 
implicate în aceste constrângeri mai întâi, indiferent de dimensiunea domeniului. 


5.4.2 Selectarea valorilor 


Algoritmul de căutare trebuie să aibă definită o ordine în care vor fi asignate 
valorile variabilelor. O ordonare bună a valorilor poate avantaja procesul de căutare. 
O direcţie care conduce la o soluţie este verificată mai devreme decât cele care 
conduc la situații de blocaj. Această situație este valabilă pentru cazul în care se 
doreşte determinarea unei soluţii. In cazul în care dorim să identificăm toate soluţiile 
problemei, sau în caz de inconsistenta, această ordine nu contează atât de mult. 

In majoritatea cazurilor, se alege valoarea cea mai puţin constrânsă, care 
maximizeaza deci opțiunile viitoare de instantiere. 
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Pe baza principiului de mai sus s-au mai propus şi alte câteva metode pentru 
selectarea valorii variabilei curente. Se verifică pentru fiecare valoare în parte 
domeniile variabilelor viitoare (similar procedurii Forward-checking). Se alege 
valoarea cu costul cel mai mic, unde costul este dat de procentul de valori din 
domeniile viitoare care nu vor mai putea fi utilizate. O altă variantă propusă constă în 
selectarea celei mai “promițătoare” valori, adică cu cea mai mare valoare pentru 
produsul dimensiunii domeniilor variabilelor viitoare. Aceste variante sunt din păcate 
destul de costisitoare. In general, beneficiul alegerii unei valori care are o 
probabilitate mai mare de a conduce către o soluție nu este contrabalansat de 
efortul depus în Forward-checking pentru fiecare valoare. In cazuri particulare, 
există informaţie suplimentară care poate fi utilizată pentru selectarea unei astfel de 
valori. 

O descriere a tehnicilor generale de rezolvare a problemelor de satisfacere a 
constrângerilor poate fi consultată şi în tutorialul on-line al lui Bartak (vezi Bartak, R. 
în referințe). 


5.5 Metode stochastice 


Deoarece majoritatea problemelor din lumea reală sunt supra-constrânse şi 
nu au o soluţie exactă, este preferat un algoritm de căutare stochastică pentru o 
rezolvare mai rapidă a problemei. Abordări bazate pe metaeuristici şi paradigme 
inspirate din natură s-au dovedit a fi eficiente în domeniul inteligenţei artificiale 
aplicate şi cel al optimizării combinatorii. Au fost încercate şi pentru problemele de 
satisfacere a constrângerilor metode de căutare locală, ca euristicile min-conflicts, 
stochastic local search, sau metaeuristici precum algoritmii genetici (Craenen, 
2003). 

Algoritmii de căutare locală pornesc cu o asignare completă, şi la fiecare pas, 
încearcă să o îmbunătăţească prin modificarea valorii unei variabile. Asignarea 
iniţială este generată aleator sau utilizând o metodă deterministă. Funcţia de 
evaluare a unei astfel de soluţii poate fi, în cazul problemelor CSP, numărul de 
constrângeri violate. Variabila a cărei valoare va fi modificată, respectiv noua 
valoare în cel mai simplu caz, sunt alese aleator. 

De exemplu, pentru problema reginelor, starea iniţială este o configuraţie 
aleatoare a reginelor pe coloane. Un pas al algoritmului ar consta în alegerea unei 
regine şi mutarea acesteia pe o altă poziţie în cadrul coloanei respective. 

Euristica min-conflicts selectează valoarea care minimizează numărul de 
conflicte. Metoda s-a dovedit a fi eficientă pentru problema reginelor: găseşte soluția 
după un număr mic de iterații. Rezultate bune s-au obținut şi pentru probleme de 
planificare. 

In cazul în care problema nu are soluţie, algoritmii stochastici nu pot detecta 
acest lucru. Avantajul utilizarii lor îl constituie faptul că pot determina un optim local 
destul de bun pentru problemele în care algoritmii determinişti nu sunt fezabili. 


5.6 Concluzii 


În acest capitol am prezentat o descriere sumară a problemelor de 
satisfacere a constrângerilor. Multe probleme din lumea reală pot fi modelate ca 
probleme CSP. Printre tehnicile de rezolvare a acestora se numară scheme de 
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backtracking inteligent şi inferenta. Euristicile de ordonare a variabilelor şi a valorilor 
îmbunătățesc căutarea. 


Cerinţe pentru studenți 


să recunoască care probleme pot fi modelate ca probleme CSP 
să identifice metoda cea mai potrivită pentru o problemă CSP 


Probleme 


P5.1 Formulati următoarele probleme ca probleme de satisfacere a constrângerilor: 


Problema planificării unei suprafeţe dreptunghiulare (rectilinear floor-planning): data 
o mulțime de dreptunghiuri mici, să se amplaseze aceste dreptunghiuri pe o 
suprafața dreptunghiulară mai mare astfel încât acestea să nu se suprapună. 
Pătratul magic: să se aranjeze cifre de la 1 la 9 într-un pătrat de 3x3 astfel încât 
suma celor 3 numere din fiecare linie, coloană şi diagonală să fie aceeaşi. 

Problema planificării examenelor: să se planifice examenele unei mulţimi de 
studenți. Pentru fiecare student se cunosc obiectele la care acesta are de susținut o 
probă. Posibilele perioade de timp sunt stabilite apriori. Condiţia principală este ca 
examenele unui student sa fie programate în perioade diferite. 


P5.2 Modelati problema de mai jos ca o problema CSP: 


Cinci copii sunt în spital şi fiecare este vizitat în perioada stabilită pentru vizite de un prieten 
sau o rudă. Acesta ii aduce două cadouri: ceva de mâncare sau de băut şi o jucărie. 
Problema este de a identifica pentru fiecare copil care este vizitatorul său şi cadourile pe 
care le-a primit, având date următoarele informaţii: 


Cei cinci copii: Maria, Ana, Petru, Ştefan, loana; 
Vizitatorii: matuşa, tata, prietenul, bunicul, mama; 
Cadouri: banane, prajitură, jeleuri, suc de portocale, caramele; 
carte de colorat, minge, papusa, cărţi de joc, carte de povești. 


Mai ştim în plus: 


Copilul care a primit păpuşa nu a primit dulciuri. 

Bananele şi cărţile de joc au fost date aceleeasi fetițe. 

Persoana care a cumpărat sucul de portocale nu a fost o rudă de sex feminin. 
Prietenul lui Ştefan i-a adus mingea. 

Papuşa a fost dăruită unei fetiţe. 

Prajitura a fost pentru ziua Mariei. 

Caramelele au fost date unui băiat. 

Vizitatorul loanei nu a fost o rudă de sex feminin. 

Bunicul Anei i-a adus dulciurile ei preferate. 

Vizitatorul lui Petru a fost mătuşa lui; el nu a primit cartea de colorat. 


Aplicati algoritmul Arc-consistenta pentru aceasta problemă. 


P5.3 Fie urmatoarea problema de satisfacere a constrangerilor, data prin graful constrans 
din Figura 5.10. Domeniile variabilelor sunt: D;={P, K, B}, D={U, L, 1), Ds=(V, U, N), Dy={K, 
J, E, B}. Constrangerile exprimă ordinea lexicografica între variabilele implicate în relaţie. 
Descrieti paşii algoritmului Backjumping pentru această problema. 
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X, < Xə 


A 


X3 > X 4 
Figura 5.10: graful constrâns 


P5.4 Consideraţi problema 8-regine. Exemplificati printr-o situaţie utilitatea algoritmului 
Backjumping relativ la Backtracking. 


P5.5 Modelati problema reprezentată de puzzle-ul de mai jos ca o problema CSP. Propuneţi 
cel puţin două variante de modelare. Rezolvaţi problema utilizând metoda Forward-checking 
combinată cu euristica MRV de selectare a variabilei şi euristica care selectează valoarea 
cea mai putin constrânsă. Descrieti pas cu pas execuţia algoritmului. 
SATURN 
+URANUS 


=PLANETS 


P5.6 Fie următoarele opt pătrate poziționate ca în Figura 5.11: 


Figura 5.11: pătratele neetichetate inițial 


Problema constă în etichetarea pătratelor cu numere de la 1 la 8 astfel încât etichetele 
oricărei perechi de pătrate adiacente (orizontale, vericale sau diagonale) să difere prin cel 
putin 2. 

e Scrieți constrângerile sub formă de relaţii şi desenati graful constrâns. 

e Este reţeaua arc-consistentă? Daca nu, aduceti-o la o forma arc-consistenta. 

e Este reteua consistenta? Daca da, dati exemplu de o solutie. 


P5.7 Utilizati metoda de cautare locala min-conflicts pentru a rezolva problema celor 4 
regine. Initial considerati reginele pe diagonala principala. 
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Capitolul 6 
Învăţarea automata 


Înălțimea unui munte nu este măsurată calculând efortul 
necesar pentru a ajunge în vârf. 


Friedrich Nietzsche 


6.1 Descriere generală 


Învăţarea automată, unul din sub-domeniile de bază ale Inteligentei Artificiale, 
se preocupă cu dezvoltarea de algoritmi şi metode ce permit unui sistem informatic 
să înveţe date, reguli, chiar algoritmi. Invatarea automată presupune în primul rând 
identificarea şi implementarea unei modalităţi cât mai eficiente de a reprezenta 
informaţii, în sensul facilitării căutării, re-organizării şi modificării lor. Alegerea 
modului de a reprezenta aceste date tine atât de concepția generală asupra modului 
de rezolvare a problemei, cât şi de caracteristicile datelor cu care se lucrează. 

Invatarea nu se poate face pe baza unui set foarte mare de cunoştinţe, atât 
din cauza costurilor mari presupuse de acumularea unor baze de informații mari cât 
şi din cauza complexității memorării şi prelucrării unui volum mare de informaţii. In 
acelaşi timp însă, învăţarea trebuie să ducă la formularea de suficiente “reguli” atât 
cât să permită rezolvarea unor probleme dintr-un spaţiu mai larg decât cel pe baza 
căruia s-a făcut învățarea. Adică învățarea trebuie să îmbunătățească performanța 
unui sistem nu doar în rezolvarea repetată a unui acelaşi set de probleme, ci şi în 
rezolvarea unor probleme noi. Acest lucru presupune o generalizare a unei metode 
de rezolvare pentru a acoperi un număr cât mai mare de instanţe posibile, dar şi 
păstrarea unei specializări suficiente pentru a fi identificate corect instanţele 
acceptate. Aceasta se poate face fie inductiv, generalizând o problemă plecând de 
la un set de exemple, fie deductiv, plecând de la o bază de cunoştinţe suficiente 
asupra universului problemei şi extrăgând date şi reguli esenţiale. Pentru a putea 
face acest lucru, un algoritm de învăţare trebuie să fie capabil să selecteze acele 
elemente semnificative pentru rezolvarea unei instante viitoare a problemei. Aceasta 
alegere se face pe baza unor criterii de selecție numite diagonale inductive. 

O altă componentă esenţială al unui algoritm de învăţare este metoda de 
verificare, o metodă capabilă să confirme dacă generalizările făcute sau regulile 
deduse se apropie mai mult de soluţia ideală decât starea anterioară a sistemului. O 
prezentare mai detaliată a componentelor esenţiale ale unui sistem capabil de 
învăţare este făcută în secțiunea a doua a acestui capitol. 

Studiul învățării automate a dus la descrierea a numeroase metode, variind 
după scop, date de antrenament, strategia de învățare şi modalitatea de 
reprezentare a datelor. Secţiunea a treia face o prezentare a principalelor direcții în 
învățarea supervizată, ce foloseşte un set de instanţe rezolvate ale problemei pentru 
a antrena sistemul în vederea rezolvării unor instanţe noi. Secţiunea a patra prezintă 
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învăţarea prin încurajare, ce implementează o metodă de a “răsplăti” sistemul în 
funcție de progresul făcut în găsirea unei soluții optime. Algoritmii genetici, 
prezentaţi în secţiunea a cincea, folosesc metode de reprezentare şi căutare 
similare mecanismelor biologice. Secţiunea a şasea prezintă învăţarea bazată pe 
cunostinte, ce deduce soluţii pe baza unor cunoştinţe anterioare asupra domeniului 
problemei. Secţiunea a şaptea face o prezentare a dezavantajelor conceptului de 
învăţare supervizată, iar apoi în secţiunea a opta se descrie învățarea nesupervizată 
şi problema clasificării. 


6.2 Caracteristici ale unui sistem capabil de învăţare 


Specificarea unei metode de învăţare automată presupune definirea 
următoarelor date: 

- scopul metodei şi baza de cunoştinţe necesară; 

- formalismul de reprezentare a datelor utilizate şi a celor învăţate; 

- un set de operaţii asupra datelor disponibile şi învăţate; 

- un spaţiu general al problemei în care se va specifica soluţia; 

- opţional, reguli euristice pentru căutarea în spaţiul problemei. 


6.2.1 Scopul metodei şi baza de cunoştinţe necesară 


O metodă de învăţare este definită în primul rând de datele de plecare şi 
scopul algoritmului, adică ce se doreşte sa se obţină pe baza acestor date. Plecând 
de la aceste caracteristici, avem următoarele variante: 

- datele de plecare sunt un set de exemple pozitive şi negative de instante 
ale problemei, algoritmul trebuind să găsească o generalizare care să 
includă instanţele pozitive şi să le excluda pe cele negative; 

- datele de plecare constau într-un set redus de exemple pozitive, iar 
algoritmul, plecând cu o bază de cunoştinţe generale asupra domeniului 
problemei, trebuie să facă o generalizare; 

- datele de plecare sunt un set de instante neclasificate, algoritmul trebuind 
să identifice clase de instanţe cu proprietăți similare; 

- date de plecare sub forma uneia sau a mai multor instante ce descriu 
situații ca fiind analogii ale problemei de rezolvat, algoritmul trebuind să 
identifice elementele ce formează analogia şi să deducă soluţia problemei. 

Datele din baza de cunoştinţe mai sunt caracterizate şi de acurateţea şi 
calitatea lor. Cel ce învaţă trebuie să ţină cont de încrederea în sursa de informaţii şi 
de detalierea şi gradul de organizare a informațiilor. 

Anumite date ce ar putea contribui semnificativ la acurateţea unei metode de 
învăţare, dacă ar fi prezente în baza de cunoştinţe, pot fi prea greu de obținut. 
Raportul pret / câştig de informatie trebuie avut în vedere atât în crearea bazei de 
cunoştinţe cât şi în descrierea metodelor de învăţare. 


6.2.2 Formalismul de reprezentare a datelor utilizate şi a celor învățate 


Conceptele şi instanțele problemei utilizate în algoritmul de învăţare 
trebuiesc formalizate ca expresii sau obiecte cu proprietăți cuantificabile şi clar 
definite. Reprezentarea acestor proprietăţi se face în general într-o formă 
structurată, cum ar fi un tabel sau un graf. 
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Un exemplu de descriere a unor instante folosind logica propozitionala este: 


mărime (objl,mică) A culoare(objl,roşie) A forma (objl1, rotundă) 
mărime (0obj2,mare) A culoare(obj2, roşie) ^ forma(obj2, rotundă) 


iar descrierea unui concept general pentru instanţe de tipul celor de mai sus ar fi: 


mărime (x,y) A culoare(x,z) A forma (x, rotundă) 
6.2.3 Setul de operații 


Algoritmul trebuie să aibă la dispoziţie unelte care să îi permită manipularea 
datelor în reprezentarea specifică. Operaţiile necesare sunt în general cele de 
generalizare şi specializare a unui concept, de modificare şi adăugare de instanţe şi 
expresii, de căutare în spaţiul problemei. 

Operatorii de generalizare şi specializare sunt esentiali în orice algoritm de 
învăţare. Tipurile principale de generalizări folosite sunt: 

- înlocuirea constantelor cu variabile; Exemplu: 


culoare (0bjl, roşie) se generalizează 
culoare (x,roşie) Y culoare (x,y) 


- renunţarea la condiţii dintr-o conjunctie; Exemplu: 


mărime (objl,mică) A culoare(obj1,rosie) A 
forma (obj1, rotunda) se generalizeaza 
culoare (0bj1, roşie) A forma(obj1, rotunda) 


- adăugarea unei disjunctii la o expresie; Exemplu: 
mărime (objl,mică) A culoare(objl,roşie) 
forma (obj1, rotundă) se generalizează 
mărime (objl,mică) A culoare (objl,roşie) 
forma (obj1, rotundă) Y mărime(objl,mare) 


- înlocuirea unei proprietăţi cu o descriere mai generală; Exemplu: 


culoare (0bjl, roşie) se generalizează 
culoare (obj1, culoare_de_baza) 


Mărimea setului de operaţii disponibile şi complexitatea lor sunt lucruri care 
au în general un impact puternic asupra rezultatelor obținute prin învăţare, asupra 
vitezei învăţării. De asemenea, operaţiile disponibile restrâng soluţiile posibile la cele 
care pot fi obținute şi exprimate prin aceste operaţii, deci definirea lor trebuie să fie 
considerată una din cele mai importante etape, atât în descrierea algoritmilor de 
învăţare cât şi în formularea problemelor pentru sistemele de învățare automată. 
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6.2.4 Spatiul general al problemei 


Limbajul de reprezentare şi setul de operaţii descriu un spaţiu de definiție a 
conceptului problemei. Invatarea constă în “navigarea” prin acest spaţiu în scopul 
ajungerii la un concept-tinta sau la noi cunoştinţe. Dificultatea rezolvării problemei 
este direct proporţională cu complexitatea acestui spaţiu general al problemei. 

Evident, dimensiunea sa este strâns legată de formalismul de reprezentare 
ales şi de operaţiile descrise pentru aceste reprezentări, lucruri ce sunt făcute odată 
cu descrierea metodei de învăţare şi formularea problemei. Aceasta înseamnă că 
putem descrie o metodă de învățare rapidă, pe un spaţiu mic de soluții, dar 
formalismul de reprezentare şi operaţiile nu vor avea o putere expresivă mare. 
Trebuie avut în vedere echilibrul între puterea descriptivă şi timpul de găsire a unei 
soluții. De asemenea, de aici rezultă şi faptul că o metodă de învăţare concepută 
pentru o problemă specifică se va comporta de obicei mai bine decât o metodă 
generală de învăţare. 


6.2.5 Reguli euristice pentru căutare 


Ordinea şi modalitatea prin care se face căutarea în spațiul de soluţii al 
problemei sunt, în general, stabilite printr-un set de reguli euristice. Aceste reguli 
directioneaza algoritmul şi îl ajută să ia decizii în privința momentului şi felului în 
care se poate generaliza sau specializa un concept, sau se poate introduce un 
concept nou. Aceste euristici sunt în general descrise odată cu algoritmul propriu- 
zis, fiind proprii fiecărei metode de învăţare. 

Aceste reguli pot lipsi, ele nefiind în general esenţiale funcţionării algoritmului, 
ci având doar rolul de a optimiza funcţionarea sa. 


6.3. Învățarea supervizată 


Învățarea supervizată este un tip de învăţare inductivă ce pleacă de la un set 
de exemple de instante ale problemei şi formează o funcție de evaluare (şablon) 
care să permită clasificarea (rezolvarea) unor instante noi. Invatarea este 
supervizată în sensul că setul de exemple este dat împreună cu clasificarea lor 
corectă. Aceste instanţe rezolvate se numesc instanțe de antrenament. Formal, 
setul de instante de antrenament este o mulţime de perechi atribut-valoare (x,f(x)), 
unde x este instanţa iar f(x) clasa căreia îi aparţine instanţa respectivă. De exemplu, 
un set de instante de antrenament ar putea fi: 


Il: (culoare(objl,roşie) A forma(objl,rotundă), 
f (obj1)="sfera”) 
I2: (marime(obj2,mare) A forma(obj2,cubica), f(ob]2)="cub”) 


Scopul invatarii este construirea unei functii-sablon care sa clasifice corect 
instantele-exemplu, iar pentru un x pentru care nu se cunoaste f(x) sa propuna o 
aproximare cat mai corecta a valorii f(x). 


6.3.1 Concepte invatabile PAC 


Teoria invatarii Computationale propune o baza teoretica pentru sistemele 
capabile de invatare. Problema principala care se pune este: cum demonstram 
faptul ca un şablon se apropie de perfecţiune în etichetarea oricăror instante noi? 
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Fie f funcţia pe care dorim să o aproximăm, S un set de instante de antrenament 
(x,f(x)) , iar h funcţia indusă prin învăţare. Este sau nu h(x) aproape de f(x), pentru 
orice x din spaţiul instanţelor posibile? 

Argumentul standard este acela că h nu poate fi prea departe de f, căci h 
clasifică corect instanţele de antrenament, deci probabil şi pe celelalte. Deci h este 
probabil aproximativ corect (PAC). Un concept este invatabil PAC dacă există un 
algoritm eficient care are o probabilitate mare de a găsi o aproximare a conceptului 
probabil aproximativ corectă. Termenul “invatabil PAC” a fost introdus de Valiant 
(1984). 

Presupunerea aflată la baza acestei justificări este aceea că instanţele de 
antrenament şi instanțele de testare sunt uniform distribuite în spaţiul instanțelor 
posibile ale problemei. Acest lucru este fundamental în justificarea oricărui rezultat al 
unei învățării supervizate. 

Pentru calculul devierii unei functii-sablon h fata de f, putem defini o funcţie 
de eroare E(h) ca fiind: 


E(h) = Pr(h(x) != f(x) | x din D) 


unde D este o mulțime de instante uniform distribuite in spațiul instanțelor posibile. 
Şablonul h este numit aproximativ corect dacă E(h)<=e, unde e este o probabilitate 
maximă de eroare. 

Capacitatea unui concept de a fi invatabil PAC este independentă de 
algoritmul folosit. Atunci de ce depinde? Cum recunoaştem un concept invatabil? 
Răspunsul stă în capacitatea acelui concept de a fi reprezentat printr-o formalizare 
neambiguă. Concepte ca minge, pătrat, profitabil pot fi definite prin proprietăţi ce le 
identifică în mod unic. Aceste proprietăţi pot fi definite pentru că există limbaje de 
reprezentare pentru ele. Aceste concepte pot fi învăţate cu atât mai uşor cu cât 
numărul de proprietăţi ce le definesc în mod unic este mai mic. 


6.3.2 Arbori de decizie 


Un arbore de decizie este una din cele mai utilizate structuri de reprezentare 
utilizate în învăţarea automată. Pentru o instanţă specificată de un set de proprietăţi, 
arborele verifică anumite proprietăţi pentru a “naviga” prin arbore şi ajunge la o 
frunză care va fi “eticheta” acelei instanţe. Fiecare nod intern al arborelui reprezintă 
un test făcut asupra uneia sau mai multor proprietăţi ale instanţei, iar ramurile 
descendente din acel nod sunt identificate de posibilele rezultate ale acelui test. 

Un arbore de decizie construieşte pentru o instanţă o conjunctie logică ce se 
verifică pentru proprietăţile instanţei şi formează un fel de demonstraţie a clasificării 
făcute pe baza acelor proprietăţi. 

Ca exemplu, fie arborele binar de decizie din Figura 6.1. 
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Patrulater? 


nu 
Unghiuri Altceva 
drepte? 
Laturi 
egale? 
da nu 
Pătrat Dreptunghi Romb Trapez 


Figura 6.1: Exemplu de arbore binar de decizie 


Acest arbore identifică tipurile de patrulatere ţinând cont de anumite 
proprietăți de bază. O instanță de intrare pentru acest arbore este o figura 
geometrică definită de proprietăţile sale. Arborele face anumite teste şi ajunge la un 
nod terminal care identifică tipul figurii geometrice, dacă este un patrulater, sau 
răspunde “Altceva” dacă nu este un patrulater. Drumul luat pentru a ajunge la 
răspuns poate fi reconstituit şi formează o “demonstraţie” a răspunsului. 

De exemplu, pentru instanţa: 


Drumul parcurs va forma demonstraţia: 


Figura este romb, deoarece este patrulater si nu are 
unghiuri drepte şi are laturile egale. 


Avantajul principal al arborilor de decizie este acela că minimizează numărul 
de teste la cele suficiente pentru a formula un răspuns. Avantajul este evident chiar 
în exemplul dat: arborele identifică orice figură geometrică, indiferent de proprietățile 
sale. De exemplu, pentru instanţa: 
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arborele nu va verifica proprietatile nerelevante pentru problema, ci va face 
testul “Patrulater?”, şi va răspunde imediat “nu”. 

Învățarea unui arbore de decizie plecând de la un set S de exemple 
etichetate şi mulţimea P de proprietăți se face după algoritmul: 


ConstruiesteArbore (S) 
begin 
if (toate elementele din S au aceeaşi etichetă) then 
întoarce un nod terminal cu eticheta respectivă 
else 
{ do 
(caută proprietatea p din P cu cel mai mare câştig de 
informație (vezi 6.3.3); 
crează un arbore de decizie cu rădăcina conținând testul 
acelei proprietăți; 
leagă subarborele rezultat la ramura curentă; 
)while (există rezultat posibil al testului acelei 
proprietăți neinclus în arbore) 


) 
return arborele; 
end 


Elementul esenţial este, evident, identificarea proprietăţii ce aduce cel mai 
mare câştig de informaţie prin testarea ei în arborele de decizie. 


6.3.3 Calculul câştigului de informaţie 


Teoria informaţiei (Shannon,1948) este baza matematică ce permite calculul 
conținutului de informaţie al unui mesaj. Un mesaj poate fi privit ca un răspuns la o 
întrebare /. Astfel, dacă răspunsurile posibile sunt v; iar probabilitățile lor de apariție 
sunt P(v;), conţinutul de informatie al răspunsului la întrebarea / este dat de formula: 


T(P(vi), «eee P(Vn)) = Niet ian P(Vi) logz P (vi) 

Pentru arborii de decizie vrem sa aflam insa castigul de informatie al unui 
răspuns la o întrebare, comparativ cu celelalte întrebări posibile. Pentru a calcula 
câştigul de informatie al unui test T se utilizează formula: 

Castig(T) = I(1-p(vi )/IS|, ., 1-pP(yn )/IS|) - CostUlterior (T) 
unde /S/ este cardinalul mulțimii de instante de antrenament, p(v;) numărul de 
instante pentru care răspunsul la întrebarea / este v; , iar CostUlterior(T) reprezintă 
cantitatea de informaţie necesară pentru a finaliza arborele de decizie în cazul 
selectării testului T la pasul curent. 


CostUlterior (T) = Ja Sb. dany (ISil)/ (ISI) x I (1-pi (vir )/IS:il, eer T= 
Pi (vin )/ISi1) 
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unde S; este mulţimea de instante care au valoarea v; pentru proprietatea 
testata. 


Exemplu de constructie a unui arbore ID3 


Sa presupunem ca dorim sa antrenam un arbore de decizie capabil sa 
hotarasca daca ziua va fi buna pentru ski. Pentru antrenare, construim instante 
pentru ultimele două săptămâni, colectând pentru fiecare zi informaţii privind 
prognoza meteo pentru ziua respectivă, temperatura înregistrată, umiditatea 
atmosferică şi vântul. Pentru aceşti parametri, selectăm din următoarele variante: 


prognoza: (optimistă, neutră, proastă) 
temperatura: (cald, optim, frig) 
umiditatea: (mare, normală) 

vântul: (puternic, slab) 


Pentru două săptămâni, respectiv cele 14 zile folosite ca instanțe de 
antrenare, avem datele din Tabela 6.1. 


Tabela 6.1: Instante de antrenare 


Zi prognoza temperatura |umiditatea  |vântul Optim ski? 
1 optimista cald mare slab nu 
2 optimista cald mare puterninc nu 
3 neutra cald mare slab da 
4 proasta optim mare slab da 
5 proasta frig normala slab da 
6 proasta frig normala puterninc nu 
7 neutra frig normala puterninc da 
8 optimista optim mare slab nu 
9 optimista frig normala slab da 
10 proasta optim normal slab da 
11 optimista optim normala puterninc da 
12 neutra optim mare puterninc da 
13 neutra cald normala slab da 
14 proasta optim mare puterninc nu 


Pentru valorile de mai sus, se calculeaza castigul de informatie pentru fiecare 
parametru (dupa formulele de mai sus): 


Castig(prognoza) = 0,246 
Castig(temperatura) = 0,029 
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Castig(umiditatea) = 0,151 
Castig(vant) = 0,048 


Se observa ca evaluarea parametrului prognoza obtine cel mai mare castig 
de informatie, deci el este folosit ca test in nodul rădăcină al arborelui ID3. 


Prognoza 


optimistă proastă 


neutră 


DA 


Figura 6.2: Arbore ID3 partial 


Valoarea neutră pentru parametrul Prognoza corespunde doar 
răspunsului pozitiv pentru testul „Este ziua optimă pentru ski?”. Cum au rămas încă 
instanțe neacoperite, se completează arborele adăugând pe rând testul cu cel mai 
mare câştig de informaţie, re-calculat după fiecare modificare a arborelui. Se obţine 
arborele din Figura 6.3. 


Prognoza 


optimistă 


Umiditatea 


mare normală 


proastă 


puternic 


neutră 


slab 


NU DA NU DA 


Figura 6.3: Arborele ID3 pentru exemplu 


Se observă că testul parametrului temperatura nu este necesar pentru 
clasificarea corectă a tuturor instanţelor de antrenament. 


6.3.4 Probleme în utilizarea arborilor de decizie 


Algoritmul de învățare pentru arbori de decizie poate găsi proprietăți 
nerelevante, dar regulate, ca fiind esenţiale în etichetarea unei instanțe. Dacă 
numărul de proprietăţi este mare, iar exemplele sunt insuficient de “imprastiate” în 


spațiul problemei, algoritmul poate deduce că, de exemplu, culoarea neagră este 
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semnificativă pentru a decide dacă o figură geometrică este patrulater. Aceasta 
problemă se numeşte suprapunerea seturilor. 

O alta problemă semnificativă este aceea a luării unei decizii privind 
adăugarea de noduri în arbore. Este posibil ca adăugarea unui nou test în arbore să 
nu îmbunătățească precizia sa de clasificare, sau chiar să o scadă. 

O soluţie la ambele probleme este folosirea unei metode de a directiona 
căutarea în mulțimea de proprietăți pentru a asigura identificarea celei mai directe 
căi spre soluţia corectă. In acest scop, unei proprietăţi îi asociem şi o valoare de 
relevanţă statistică pe baza căreia determinăm şansa ca relevanta proprietății 
respective să fie independentă de setul de instanțe pe care antrenăm arborele. 
Astfel eliminăm testarea oricărei proprietăţi cu probabilitate mare de a fi irelevantă 
pentru scopul învăţării. 

Altă soluţie este validarea încrucişată, o metodă ce testează submultimi de 
instanțe pentru a vedea cât de bine ar fi clasificate folosind testul curent. Se 
realizează o medie a rezultatelor pentru testele verificate şi media se foloseşte la 
selectarea testelor viitoare. 

O altă problemă este necesitatea existenţei unui set complet de proprietăți 
pentru instanţele problemei. Pentru clasificarea unei instanțe, arborele de decizie 
poate testa oricare din proprietăţile sale, deci nu putem folosi instanţe cu proprietăți 
ale căror valori sunt necunoscute. Există mai multe variante de a permite 
algoritmului să lucreze cu seturi incomplete de proprietăţi ale instanţelor: putem da 
unei proprietăţi necunoscute o valoare pe baza valorilor luate în instanţe similare, 
sau putem chiar construi un arbore de decizie pentru a găsi o valoare pentru acea 
proprietate. Cea mai simplă metodă este însă de a atribui acelei proprietăţi valoarea 
cea mai des întâlnită în setul de instanţe. 

Algoritmul de învăţare pentru arbori de decizie a fost definit in forma inițială în 
(Quinlan,1983), unde sunt descrişi un tip de arbori de decizie numiţi ID3. In acea 
formă, proprietățile luau doar valori booleene, rezultând deci arbori binari de căutare. 
O extindere evidentă ar fi folosirea unor proprietăți cu valori multiple, lucru făcut într- 
o formă ulterioară a algoritmului (ID5 — Utgoff,1988). ID5 mai adaugă şi construirea 
incrementală a arborelui, exemplele de intrare fiind tratate pe rând, în urma fiecărui 
exemplu rezultând un arbore de decizie ce va fi îmbunătăţit de exemplele ulterioare. 
De asemenea, instanţele propriu-zise sunt păstrate în frunzele arborelui şi sunt 
folosite pentru a determina necesitatea adăugării unui nou nod de testare la acel 
nivel. 


6.3.5 Inducerea şabloanelor logice 


Învățarea inductivă înseamnă practic căutarea unui şablon descriptiv cu care 
să fie comparate instanţe noi ale problemei. Iniţial, şablonul propus este vag, el fiind 
detaliat atunci când întâlnim o instanţă fals pozitivă (o instanţă incorectă clasificată 
corectă) sau fals negativă (o instanță corectă clasificată incorectă). Căutarea 
instanţelor clasificate incorect şi corectarea sablonului se poate face în două moduri: 
metoda şablonului prezent optim şi metoda angajamentului minim. 

Metoda şablonului prezent optim (Mill, 1843) modifică şablonul în cazul găsirii 
unei instanţe incorect clasificate după metoda: 

- daca instanţa este fals pozitivă, specializează şablonul pentru a nu mai 

acoperi acea instanţă prin renunţarea la disjunctii sau adăugarea de noi 
termeni; 
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- daca instanţa este fals negativă, generalizează sablonul prin adăugarea 
de disjunctii sau renunţarea la unii termeni; 

- daca nu poate fi găsit un şablon valid, revin la optimul precedent. 

Punctul slab al acestei metode este numărul mare de teste necesare la 
fiecare modificare a şablonului, căci fiecare instanţă trebuie verificată din nou. 

Metoda angajamentului minim (Mitchell,1978) propune păstrarea tuturor 
şabloanelor posibile ce sunt consistente cu instanţele testate până în momentul 
curent. Cu fiecare nouă instanță se elimină din spațiul versiunilor şabloanele 
inconsistente cu acea instanţă. Algoritmul ce realizează acest lucru se numeşte 
algoritmul de învăţare prin eliminarea candidaților (Mitchell, 1982) şi are forma: 


Eliminarea candidaților (G, 8) 
begin 
Initializeaza G cu cel mai general concept din spațiu; 
Initializeaza S cu prima instanță pozitivă din intrare; 
for (fiecare instanță pozitivă p) 
begin 
Şterge toate instanțele din G care nu se potrivesc cu p; 
for (fiecare s din S) 
if (s nu se potriveşte cu p) then înlocuieşte s cu 
cea mai specifică generalizare care se potriveşte cu PR; 
Şterge din S toate instanțele mai generale decât alta din S; 
Şterge din S toate instanţele mai putin specifice decât 
alta din G; 
end; 
for (fiecare instanță negativă n) 
begin 
Şterge toate instanțele din S care se potrivesc cun; 
for (fiecare g din G care se potriveşte cu n) 
înlocuieşte g cu cea mai generală specializare care 


nu se potriveşte cun; 
Şterge din G toate instanțele mai specifice decât alta 
din G; 
Şterge din G toate instanțele mai specifice decât alta 
din S; 
end; 
if (G=S si ambele contin o singură instanță) then acea instanţă este 


conceptul căutat; 
else if (G si S sunt vide) then nu există un concept care să acopere 
toate instanţele pozitive şi nici una din cele negative; 

end. 


Multimile G şi S contin informaţia atât din instanțele pozitive cât şi din cele 
negative şi nu mai este necesar ca ele să fie reținute separat. Algoritmul foloseşte G 
pentru a testa specificitatea conceptelor din S şi S pentru a testa generalitatea 
conceptelor din G, cele două mulțimi definind astfel doua limite între care se va găsi 
şablonul optim, în caz că el există. 

Problema principală în identificarea oricărui şablon este sensibilitatea 
algoritmilor la instanţe neconsistente. Algoritmii nu au nici o posibilitate de a decide 
dacă o instanță de antrenament este etichetată corect, deci în cazul unei 
inconsistente va eşua. Soluţiile posibile sunt fie de a menţine mai multe şabloane 
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posibile, fiecare consistent cu majoritatea instantelor, fie de a lua in considerare 
numai instantele statistic probabile. 


Complexitatea computationala 

Pentru p instante pozitive şi n instante negative de antrenament, 
complexitatea de timp a învăţării prin metoda şablonului prezent optim este O(pxn), 
iar cea de spaţiu O(p+n). 

Pentru metoda angajamentului minim, complexitatea de timp este 
O(sg(p+n)+sp+ g°n) iar cea de spaţiu este O(s+g), unde s şi g sunt dimensiunile 
maxime pentru mulțimile S respectiv G. 


6.3.6 Învăţarea Bayesiană 


Învăţarea în modelul Bayesian presupune menţinerea unor variante posibile 
ale şablonului, fiecare variantă fiind evaluată prin calcularea probabilității ca ea să 
clasifice corect o instanţă viitoare. Această probabilitate se calculează folosind 
rezultatele anterioare ale clasificărilor făcute de şablonul respectiv. La un moment 
dat, trebuie însă ca cel puţin o parte din şabloanele ipotetice să fie eliminate ca fiind 
posibile soluţii. Acest lucru se face prin stabilirea unui şablon ca fiind cel mai 
probabil şi eliminarea tuturor celorlalte, sau cel puţin a celor cu o probabilitate 
considerabil mai mica. Fie Hmax clasa de şabloane cu probabilitatea maximă. Notăm 
acea probabilitate cu P(Hmax, D), unde D este mulţimea de instante. Pentru a 
identifica probabilitatea maximă, trebuie să calculăm probabilitățile tuturor ipotezelor 
curente, folosind regula lui Bayes: 


P(Hi | D) = [P(D | Hi) x P(Hi)] / P(D) 


unde Hi este o clasa de sabloane care clasifica similar instanţele din D. Cum P(D) 
nu poate fi influenţat de algoritm, singura metodă de îmbunătăţire a probabilității de 
corectitudine este fie mărirea şansei ca setul de instanțe să ducă la găsirea unui 
şablon aproximativ corect (P(D | Hi)), fie mărirea sansei ca un şablon să fie 
aproximativ corect (P(Hi)). 
Acest model de a forma o reţea de şabloane posibile se numeşte învăţarea 
folosind o rețea de fapte. 
In funcţie de structura rețelei şi de variabilele interne, putem diferenţia patru 
tipuri de reţele de fapte: 
- rețele în care structura este cunoscută şi variabilele vizibile, în care partea 
invatabila este cea a probabilităților condiţionate ale şabloanelor; 
- rețele cu structura necunoscută, dar variabile vizibile, in care învățarea 
poate reconstrui topologia reţelei; 
- rețele cu structura cunoscută şi variabile ascunse, care sunt analoage 
rețelelor neuronale; 
- rețele cu structura necunoscută şi variabile ascunse, pentru care nu există 
nici o metoda de învăţare. 


6.3.7 Învăţarea prin încurajare 


Spre deosebire de metodele de învăţare supervizată prezentate mai sus, 
învățarea prin încurajare se face fără ca algoritmul de învăţare să compare direct 
şablonul obţinut cu rezultatele corecte pentru exemplele de antrenament. In schimb 
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este implementată o modalitate de a “răsplăti” sau “pedepsi” sistemul în funcţie de 
cât de mult se apropie de rezultatul corect. Acest feedback este singura metodă a 
sistemului de învăţare de a se regla pentru îmbunătăţirea rezultatelor sale. Acest 
lucru face învăţarea prin încurajare mai dificilă, căci sistemul nu mai primeşte 
informații directe despre cum şi cât să se corecteze, ci doar ştie dacă se apropie sau 
se depărtează de rezultatul optim. De asemenea, feedback-ul poate veni doar 
uneori, nu neapărat la fiecare schimbare în şablonul ipotetic, deci sistemul trebuie să 
aibă o modalitate de a directiona şi impulsiona singur schimbarea pentru 
îmbunătăţirea şablonului. 

Există două tipuri de informaţie ce pot face parte din feedback-ul primit de 
sistem: 

- informatie utilitara, prin care sistemul învaţă utilitatea unei anumite stări în 
care se află şi care permite sistemului să caute acele stări care 
maximizează şansa de a găsi o soluţie optima; 

- valoarea unei acţiuni, adică sistemul află potenţialul unei acţiuni de a fi sau 
nu utilă într-o anumită stare, practic potenţialul unei acţiuni de a apropia 

_ sistemul de găsirea unei soluții optime. 

Invatarea prin încurajare este utilă în situaţiile în care nu dispunem de un set 
de antrenament, nu putem identifica cu precizie instanţe valide sau eronate, fie din 
cauza complexităţii reprezentationale, fie din cauza lipsei de informaţii sigure. 
Dispunem însă de capacitatea de a aprecia corectitudinea unei soluţii obținute de 
sistem, fie chiar şi doar comparativ cu celelalte soluții. 


6.3.8 Învăţarea pasivă într-un domeniu cunoscut de stări 


Dacă furnizăm unui sistem de învăţare un domeniu de stări prin care poate 
trece împreună cu un model ce calculează şansa de a trece dintr-o stare în alta, 
sistemul poate învăţa dupa un set de secvenţe de antrenament formate dintr-un sir 
de stări consecutive în urma cărora se obține o “răsplată” cunoscută, fie pozitivă sau 
negativă. Scopul sistemului devine astfel învăţarea utilității fiecărei stări posibile. 

Presupunerea la baza învăţării utilității unei stări dintr-o secvenţă este aceea 
că “răsplata” obţinută după o secvenţă este rezultatul sumei utilităţilor stărilor ce 
compun secvenţa, adică suma pozitivă a utilităţilor stărilor favorabile adunată cu 
suma negativă a utilităţilor stărilor nefavorabile dă un număr pozitiv atunci când 
secvenţa este “răsplătită”, şi un număr negativ când secvenţa este “pedepsită”. 

Există trei modalități ca un sistem să înveţe utilitatea stărilor sale: învăţarea 
naivă, învățarea adaptiv dinamică şi învățarea după diferența temporală. 

Invatarea naivă este reprezentată de metoda minimului de stări negative 
(Least Mean Squares — LMS) (Widrow, Hoff, 1960). Metoda calculează utilitatea 
unei stări ca fiind media utilității secventelor în care ea apare. Această metodă 
minimizează într-adevăr numărul de stări defavorabile prin care ar trebui să treacă 
sistemul pentru a ajunge la un şablon satisfăcător, însă nu minimizează numărului 
de stări prin care ar trebui să treacă şi nici nu garantează găsirea celui mai optim 
şablon. 

Utilitatea unei stări găsită prin învăţarea naivă este departe de utilitatea reală, 
pentru că în calculul ei nu se tine cont de faptul că utilitatea unei stări este 
dependentă şi de suma ponderata de probabilitati ale utilităţilor stărilor ulterioare. 
Utilitatea reală a stării i este calculată după formula: 
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unde A(i) este răsplata stării i si Mj este probabilitatea trecerii din starea / în 
starea j. 

Invatarea adaptiv dinamică este reprezentată de orice metodă de învăţare 
prin încurajare care calculează utilităţile stărilor sistemului printr-un algoritm dinamic, 
după formula de mai sus. Deşi este o metodă ce dă rezultate foarte bune, ea 
prezintă dezavantajul că este foarte costisitoare în timp, căci căutarea în spațiul 
stărilor este de ordin exponențial. 

Învăţarea după diferența temporală foloseşte diferența între utilităţile stărilor 
succesive dintr-o secvenţă pentru a le ajusta la fiecare trecere prin ele. Ideea de 
baza este de a folosi tranzitiile observate pentru a ajusta utilitatea stării i pentru a se 
potrivi cu utilitatea stării succesoare j folosind ecuația: 


U(i) <- U(i) + c(R(i) + UG) - U(i)) 


unde ceste o constantă de învăţare. 

Aceasta metoda functioneaza cu atat mai bine cu cat numarul de secvente de 
antrenament in care apare fiecare stare este mai mare. Constanta c este stabilita 
anterior invatarii, in functie de dimensiunea setului de antrenare. 

Diferenţa principală între învățarea adaptiv dinamică şi învățarea dupa 
diferența temporală este că învăţarea după diferenţa temporală ajustează utilitatea 
unei stări în conformitate cu un succesor iar învățarea adaptiv dinamică ajustează 
utilităţile stărilor în conformitate cu toţi succesorii lor, în funcţie de probabilitati. O 
ajustare în cazul învăţării adaptiv dinamice se propagă în întreaga listă de utilități, pe 
când în cazul învățării după diferenţa temporală o ajustare se face numai la nivelul 
unei tranzitii locale. Pentru a diminua efectul de propagare, un sistem de învăţare 
adaptiv dinamic poate adopta o regula euristică de genul: “ajustează utilităţile doar 
stărilor pentru care utilităţile succesorilor cei mai probabil au fost mult modificate în 
pasul curent”. 


6.3.9 Învăţarea pasivă într-un domeniu necunoscut de stări 


Deoarece învățarea după diferenţa temporală şi învăţarea naivă nu tin cont de 
modelul M de calcul al probabilităților de trecere de la o stare la alta, ele 
funcţionează la fel şi în cazul unui domeniu de stări necunoscut. 

Chiar dacă nu cunoaştem modelul M, dacă domeniul de stări este suficient de 
putin complex, putem estima un model M calculând probabilitatea ca din starea i să 
trecem în starea j ca fiind Sj/S;, unde Sy este numărul de tranzitii de la jla jiar S; 
numărul total al tranzitiilor de la į la alta stare. 


6.3.10 Învăţarea activa 


Diferenta dintre un sistem pasiv si unul activ de invatare este aceea ca 
sistemul pasiv foloseste o strategie predefinita pentru a decide ce pasi sa urmeze, 
iar un sistem activ decide ce urmeaza sa faca in functie de cum estimeaza ca va fi 
afectat rezultatul învăţării. Pentru a reprezenta un sistem activ de învăţare, unui 
domeniu de stări îi ataşăm modelul M ce nu va calcula probabilitatea de trecere din 
starea i în starea j, ci probabilitatea de trecere din starea ; în starea j în urma acţiunii 
a. Utilitatea unei stări va fi calculată după formula: 
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U(1i) = R(1) + maxa X MU (3) 


Mai este utilă definirea unei funcţii de calcul a utilității acțiunii a în starea i. 
Putem calcula acest lucru după formula: 


Ua (i) = max, Q(a, i) 


unde Q(a,i) reprezintă valoarea efectuării acțiunii a în starea i rezultată in urma unei 
secvenţe de antrenament în care are loc acea acţiune. 

Practic un sistem activ de învăţare îşi auto-evaluează acțiunile posibile la 
fiecare pas de execuţie, selectând cele care măresc probabilitatea atingerii unei stări 
optime. 


6.3.11 Algoritmii genetici 


Algoritmii genetici sunt inspirați de mecanismul selecției naturale. În natură, 
organismele care nu sunt adaptate mediului înconjurător nu mai evoluează şi dispar 
în timp, iar cele adaptabile continuă sa se dezvolte. De asemenea, o generaţie a 
oricărui organism tinde să păstreze trăsăturile predecesorilor la care mai adaugă 
eventual trăsături noi dezvoltate. Algoritmii genetici simulează aceste 
comportamente. 

Un algoritm genetic are un mecanism de a selecta dintr-o “populație” de 
şabloane pe cele mai “adaptate” pentru a le dezvolta ulterior, renunțând la celelalte. 
Un individ este reprezentat printr-un şir de biti ce codifică atributele sale definitorii. 
Fiecare element component al acelui sir de biti se numeşte genă. 

Funcționarea unui algoritm genetic constă în trecerea prin mai multe generatii 
ale unei populații inițiale. La fiecare pas algoritmul selectează indivizii cu 
probabilitatea cea mai mare de a fi optimi. Indivizii astfel selectați sunt folosiți pentru 
crearea generației viitoare folosind parti din codul lor de gene pentru a forma alte 
şiruri de gene ce definesc alti indivizi. Algoritmul mai atribuie şi o sansa ca la fiecare 
nou cod de gene format să aibă loc o mutație ce va modifica la întâmplare unul sau 
mai multi biti. 

Avantajul unui algoritm de acest tip este ca nu necesita nici un fel de 
cunostinte anterioare pentru a rezolva orice fel de problema invatabila, dar 
rezolvarea dureaza mai mult decat daca am folosi alte metode. 

Algoritmii evolutivi sunt o forma mai avansată a algoritmilor genetici in care 
un individ reprezintă o structură mai complexă, cum ar fi o secvenţă de program, iar 
formarea de noi indivizi se face după metode mai elaborate. 

Sistemele de clasificare sunt algoritmi genetici care dezvoltă reguli de 
clasificare a unor instanţe. Fiecărei reguli i se atribuie un cost şi are un set de alte 
reguli ca condiţii şi alt set ca rezultate. La fiecare pas, se selectează regulile ce pot fi 
aplicate în starea curentă a sistemului, şi se alege cea care va fi aplicată în funcție 
de costul sau şi de relaţiile sale cu celelalte reguli. Costurile regulilor sunt ajustate în 
funcţie de contribuţia lor la atingerea obiectivului sistemului de clasificare. 


6.3.12 Învăţarea bazată pe cunoştinţe 


Metodele de învăţare prezentate mai sus se bazează pe generalizarea unui 
set de instanțe pentru a forma un concept. Locul şi modul în care învăţarea 
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generalizează un şablon este ales numai în funcţie de regularitatile identificate în 
setul de instante de antrenament. Aceste metode nu tin cont de semantica acelor 
instanțe, ci numai de reprezentarea lor formală. 

Invatarea care foloseşte o sursă anterioară de cunostinte referitoare la 
domeniul problemei pentru a ghida formarea unui concept nou se numeşte învățare 
supervizată deductivă sau învăţare bazată pe cunoştinţe. Avantajele acestei 
metode de învăţare sunt semnificative: setul de instante de antrenament poate fi 
mult redus, iar şansa de a ajunge la un şablon corect este mai mare, datorită 
eliminării unor generalizări făcute pe baza unor similarități aparente, dar false. 

Şabloanele posibile nu sunt extrase din regularitati identificate în instanţele de 
antrenament, ci din cunoştinţele anterioare ce explică măcar una din clasificările 
cunoscute. Invatarea deductiva nu produce nici o regulă noua ce nu poate fi dedusă 
din baza de cunoştinţe. Orice rezultat al unei invatari deductive ar putea fi deci 
obținut şi printr-un mecanism de inferenta pe baza regulilor cunoscute. Utilitatea 
învățării deductive stă însă în faptul că este o metodă mult mai rapidă de a extrage 
concepte din reguli cunoscute, căci oferă un mecanism de a directiona căutarea 
spre conceptul dorit. 


6.3.13 Învăţarea bazată pe explicații 


Învățarea bazată pe explicaţii (EBL — Explanation Based Learning) pleacă de 
la o bază de cunoştinţe anterioare despre domeniul problemei şi caută să găsească 
explicaţia clasificărilor făcute în instanţele de antrenament. Când o explicaţie este 
găsită, ea este generalizată pentru a include cât mai multe instanţe similare. 

Fie baza de cunostinte următoare: 


rotund (X) A usor(X) => minge (X) 
mic (X) => uşor(X) 
fără colţuri (X) => rotund(X) 
Din această bază de cunoştinţe şi din instanţa de antrenament: 
culoare(obj,rosu) A mic(obj) A rotund (obj) => minge (obj) 
dorim să obținem un şablon pentru a identifica obiecte cu proprietatea minge(obj). 


Un algoritm de învăţare bazat pe explicaţii va găsi justificarea instanţei pe baza 
cunostintelor, şi anume: 


mic(obj) => uşor (obj) 
usor(obj) A rotund(obj) => 
minge (obj) rotund (obj) 


Prin generalizare, va fi format sablonul: 
mic(X) A rotund(X) => minge (X) 
Forma generală a algoritmului de învăţare bazată pe explicaţii, când P este 


premiza, C — concluzia unei reguli din baza de cunoştinţe, iar S — şablonul curent 
propus, este: 
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EBL (P,C, S) 

begin 

Ts = cel mai general unificator al PxS si CxS; 

S = SxTs; 

Tg = cel mai general unificator al PxG si CxG; 

G = GxTg; 

if (P si C sunt compatibile cu o instanta de antrenament) 
begin 
Ts = cel mai general unificator al PxS si CxS; 
S = SxIs; 
end; 

end. 


G reprezintă lista substitutiilor de generalizare (înlocuire a unei constante cu o 
variabila in premiza unei reguli). 


6.3.14 Învăţarea bazată pe relevanță 


Învățarea bazată pe relevanţă este o formă de învățare automată bazată pe o 
baza de cunoştinţe ce conţine informații privind relevanta unor anumite proprietăţi 
ale unei instante, relativ la apartenenţa sa la conceptul ţintă. De exemplu, 
proprietatea unui obiect de a fi rotund are o relevanță mare în privinţa apartenenţei 
sale la conceptul minge, în schimb proprietatea sa de a avea culoarea roşie este 
irelevanta. 

Aceasta metoda presupune ca baza de cunostinte sa contina dependente 
functionale care sa contribuie la definirea conceptului. Algoritmul de invatare va 
încerca, pe această bază, să găsească implicaţii consistente cu proprietățile 
cunoscute ale instanţelor de antrenament. 


6.3.15 Învăţarea inductivă bazată pe cunoştinţe 


Învățarea inductivă bazată pe cunoştinţe foloseşte regulile cunoscute şi 
instanţele de antrenament pentru a încerca să formeze reguli noi care să explice 
proprietăţile care nu sunt justificabile pe baza cunostintelor anterioare. De exemplu, 
pentru baza de cunoştinţe: 


rotund (X) A usor(X) A sare(X) => minge (X) 
mic (X) => uşor(X) 


şi instanţele: 


rotund(obj1l) A mic(objl) A elastic (obj1) A sare (objl) => 
minge (obj1) 


rotund(obj2) A usor(obj2) A elastic (obj2) A sare (obj2) => 
minge (obj2) 
mic(obj3) A sare (obj3) => nu_minge(obj3) 


un algoritm de invatare inductiva ar observa concordanta intre proprietatile unui 
obiect uşor, elastic şi care sare. Regula obținută ar fi: 


usor(X) A elastic (X) => sare (X) 
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Principalele variante ale invatarii inductive bazate pe explicatii sunt rezolutia 
inversa si invatarea top-down. 

Rezolutia inversa se bazeaza pe faptul ca daca un concept poate clasifica o 
instanta doar pe baza setului de cunostinte atunci aceasta clasificare se poate 
demonstra printr-o rezoluţie. Scopul este de a inversa rezoluția pentru a afla 
ipotezele iniţiale de la care a plecat. 

Astfel, pentru un rezolvent C sunt obţinute două clauze C7 si C2 din care, pe 
baza regulilor cunoscute, se poate obţine C. Clauzele finale obţinute astfel devin 
premisele unei reguli a cărei concluzie este C. 

Invatarea top-down este o generalizare a arborilor de decizie pentru a acoperi 
logica clasică. Ideea este de a pleca cu o regulă foarte generală, care va fi 
specializată pentru a acoperi doar datele cunoscute. Proprietăţile unei instanţe sunt 
reprezentate ca literali, iar şablonul este un set de clauze ce simulează un arbore de 
decizie. 

Plecând de la un concept-tinta şi un set de instante de antrenament, un 
algoritm de învăţare top-down construieşte o clauză Horn, initial vidă, care clasifică o 
instanță în conceptul ţintă. La această clauză se adaugă treptat literalii care vor 
îmbunătăți cel mai mult acuratețea clasificărilor. Algoritmul continuă până la 
obținerea unei clauze care este satisfăcută de o parte a instanţelor pozitive de 
antrenament şi de nici o instanță negativă de antrenament. Clauza apoi este 
generalizată pentru a acoperi toate instanțele pozitive de antrenament. Alegerea 
literalilor ce urmează să fie adăugaţi se face pe baza unor reguli euristice. 


6.3.16 Dezavantajele învățării supervizate 


Toate metodele de învăţare prezentate în secţiunile precedente presupun 
existenţa unui set de instanţe de antrenament despre care ştim dacă aparţin sau nu 
unui concept ţintă. Ele sunt folosite pentru a verifica şi directiona modificarea 
şablonului învăţat de algoritm. 

Necesitatea existenţei acestor instanțe este punctul slab al învăţării 
supervizate, căci ele introduc o serie de probleme, cum ar fi: 


Problema limbajului de reprezentare: trebuie găsită o modalitate de a 
reprezenta instanţele şi conceptul-tinta într-o formă care să permită verificarea, 
generalizarea şi specializarea unor şabloane. Un limbaj simplu de reprezentare 
poate fi găsit relativ uşor pentru orice domeniu, dar el poate duce la spaţii foarte 
mari de căutare a conceptului-tinta. 


Inconsistenta datelor: instanţele de antrenament şi eventualele cunostinte 
anterioare ale sistemul pot fi inconsistente cu existenţa unui concept ţintă. Erorile pot 
proveni atât din clasificarea instanţelor cât şi din incapacitatea limbajului de 
reprezentare ales de a descrie conceptul țintă. 


Descrierea conceptului țintă: un algoritm de învățare poate să nu găsească 
nici un şablon corespunzător conceptului ţintă sau poate să găsească mai multe 
şabloane corespunzătoare. În cazul în care se identifică mai multor şabloane 
posibile, este probabil ca ele să fie inconsistente între ele, deci insuficient de 
generale. 
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6.4. Învățarea nesupervizată 


Învățarea nesupervizată elimină complet necesitatea unor instante de 
antrenament, deci şi problemele legate de acestea. Scopul învăţării nesupervizate 
nu este definit anterior ca un concept ţintă, algoritmul fiind lăsat singur să identifice 
concepte posibile. 

In general, învățarea nesupervizată presupune existența unor instante 
neclasificate, un set de reguli euristice pentru crearea de noi instanţe şi evaluarea 
unor concepte deduse, eventual un model general al spațiului de cunoştinţe în care 
se găsesc aceste instanțe. Un algoritm de învăţare nesupervizată construieşte 
concepte pentru a clasifica instanţele, le evaluează şi le dezvoltă pe cele 
considerate “interesante” de regulile euristice. In general, concepte interesante sunt 
considerate cele care acoperă o parte din instanțe, dar nu pe toate. 

Invatarea nesupervizata permite identificarea unor concepte complet noi 
plecând de la date cunoscute. Incercari de a aplica acest tip de învăţare in 
cercetarea ştiinţifică au dus la rezultate semnificative. Astfel AM (Davis şi Lenat, 
1982) pleca de la un set de concepte de bază din teoria mulțimilor, un set de operații 
de creare a noi concepte prin modificarea şi combinarea celor existente, şi un set de 
reguli euristice pentru a alege conceptele interesante. Algoritmul a descoperit 
numerele naturale, conceptul de număr prim, precum şi o serie de alte concepte din 
teoria numerelor. BACON (Langley, 1987) a fost o încercare de a dezvolta un model 
computaţional de dezvoltare a unor legi cantitative ştiinţifice noi. Folosind date 
privind relaţia între distanţele dintre planete şi soare şi perioada lor de revoluție, 
BACON a re-descoperit legile lui Kepler privind mişcarea planetelor. 

Totuşi aceste încercări s-au dovedit limitate în rezultate. Principalul factor ce 
limitează numărul şi relevanta conceptelor învăţate de acest gen de algoritmi este 
faptul că ele nu pot învăţa noi metode de a crea şi evalua concepte. Pentru a obține 
rezultate mai relevante, ar trebui întâi descris un set mult mai complex de operaţii 
pentru crearea de noi concepte, precum şi nişte reguli euristice mai flexibile pentru 
evalua aceste concepte. 


6.4.1 Identificarea claselor de instanțe 


Un domeniu în care învățarea nesupervizată şi-a dovedit utilitatea este cel al 
identificării automate de clase în mulţimi neclasificate de instante. Această problema 
presupune existenţa unei mulţimi de obiecte negrupate şi a unor mijloace de a găsi 
şi măsura similarități între aceste obiecte. Scopul unui algoritm de identificare a unor 
clase de obiecte este de a grupa obiectele într-o ierarhie de clase după criterii cum 
ar fi maximizarea similaritatii obiectelor din aceeaşi clasă. lerarhia de clase este 
reprezentată de obicei ca un arbore, fii unui nod reprezentând categorii distincte dar 
incluse în categoria părinte. In privința învăţării automate aplicate la identificarea 
claselor de instanțe există două abordări principale: taxonomia numerică şi 
gruparea conceptuală. 

Taxonomia numerică se bazează pe reprezentarea unui obiect ca o colecţie 
de atribute cuantificabile. Dacă reprezentăm un obiect ca un vector numeric de 
proprietăţi, atunci similaritatea dintre două obiecte cu n proprietăţi reprezintă distanța 
dintre reprezentările vectorilor respectivi în spațiul 
n-dimensional. Un algoritm de clasificare bazată pe taxonomia numerică pentru 
mulțimea de obiecte O are forma: 
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CalsificareTaxonomica (0) 
begin 
do { 
selecteaza din O perechea (X,Y) de obiecte cu cel mai mare 
grad de similaritate; 
elimină X si Y din O; 
formează o clasă nouă definită de f(X,Y), und f st d 
obicei funcţia medie aritmetică; 
while (există un obiect din O pentru care gradul de 
similaritate cu clasa nou definită este mai mare de un prag 
S) 
begin 
adaugă obiectul la clasă; 
elimină obiectul din 0; 
end; 
}while (O nu este mulțime vidă) 
end. 


Algoritmul poate fi extins si la obiecte reprezentate ca seturi de simboluri si nu 
vectori numerici. Singurul obstacol este găsirea unei metode de a măsura 
similaritatile dintre obiecte. O soluție simplă este de a calcula gradul de similaritate 
ca fiind proporţia dintre numărul de proprietăți comune şi numărul total de proprietăți. 
Cu cât această proporție va fi mai aproape de 1, cu atât obiectele respective vor 
avea şansa mai mare de a aparține aceleiaşi clase. 

Dezavantajul acestei metode de clasificare stă în faptul că nu tine cont de 
rolul semantic al proprietăților obiectelor. De exemplu, pentru obiectele: 


obiect1 = (rotund, roşu, mic) 
obiect2 (pătrat, roşu, mic) 
obiect3 (rotund, verde, mare) 


va fi găsit un grad de similaritate mai mare între obiecti si obiect2 decât între 
obiect1 si obiect3, desi proprietatea mai relevantă ar trebui să fie rotund si nu roşu si 
mic. Această metodă formează deci clase prin aprecieri subiective asupra apropierii 
dintre obiecte, şi nu foloseşte nici un mecanism de a diferenţia proprietățile în funcţie 
de relevanta lor în clasificare. 

Un alt dezavantaj constă în faptul că această metodă de clasificare nu 
construieşte definiția conceptelor pe baza cărora clasifică obiectele. Clasele sunt 
reprezentate extensional (ca o enumerare de obiecte) şi nu intensional, ca un şablon 
de recunoaştere a obiectelor fiecărei clase. 

Gruparea conceptuală rezolvă această problemă prin folosirea unor metode 
de învăţare automata pentru a defini concepte plecând de la o bază de cunoştinţe 
asupra domeniului clasificării. Forma generală a unui algoritm de învăţare pentru 
clasificarea conceptuală, aşa cum a fost descris în CLUSTER/2 (Michalski si Stepp, 
1983), este: 


ClasificareConceptuala (0) 
begin 
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do { 

selectează k obiecte din O (la întâmplare sau folosind o 
funcţie de selecţie); 

do { 

for ( fiecare obiect selectat ) folosind obiectul ca 
instanță pozitivă şi celelalte obiect selectat ca 
instanțe negative, construieşte o definiție generală a 
conceptului clasei construite în jurul obiectului selectat; 


clasifică toate obiectele din 0 folosind definițiile 
claselor obținute; 
for (fiecare definiție) 


while ( obiecte din celelalte clase nu sunt acoperite de 
această definiție ) generalizează definiţia fiecărei 
clase; 


folosind o metodă numerică, caută elementul cel mai 
apropiat de centrul fiecărei k clase formate; 
) while (nu s-au format clase satisfăcătoare şi numărul de 
încercări e mai mic decât un prag stabilit); 
) while (nu au fost obținute clase satifăcătoare); 

end. 


6.4.2 Structura cunoştinţelor taxonomice 


Algoritmii de învăţare supervizată şi metodele de clasificare prezentate mai 
sus definesc o clasă printr-o serie de atribute necesare şi suficiente pentru 
apartenenţa la acea clasă. Deşi eficientă în multe situaţii, această definiție nu 
permite o clasificare flexibilă şi structurată aşa cum întâlnim în conceptele umane. 
De exemplu, un om poate recunoaşte un obiect ca fiind un exemplu mai bun al unei 
categorii, iar alt obiect un exemplu mai prost. O vrabie este un exemplu mai bun al 
conceptului pasăre decât un pinguin. Această diferenţiere nu este permisă de 
definiția clasică a unei clase. 

Teoria asemănării familiale (Wittgestein, 1953) dă o definiţie mai apropiată 
de cea umană pentru o clasă. Astfel, o clasă este definită de sistemul complex de 
similarități între membrii ei, nu de o serie de atribute necesare şi suficiente pentru 
apartenenţa la acea clasă. Această definiție permite, în extremis, ca membrii unei 
clase să nu aibă nici măcar o proprietate comună. Un exemplu ar fi cel al clasei 
sport, ai cărei membri diferă prin numărul de jucători, regulile de joc, precum şi alte 
proprietăţi, totuşi clasa este bine definită şi neambiguă. 

Clasificările umane mai diferă de cele formale şi prin identificarea unor clase 
de bază mult mai relevante în clasificare decât generalizările sau specializările lor. 
Conceptul autoturism este mai util în descrierea unui obiect decât generalizarea sa 
vehicul sau o specializare a sa cabrioletă. In spatele unui astfel de concept de bază 
sunt mai multe informaţii recunoscute de un clasificator uman, dar nu şi de un sistem 
automat de clasificare. Orice metodă ce îşi propune să identifice clase noi de 
obiecte trebuie să tina cont de mecanismul clasificării umane. 

COBWEB (Fisher, 1987) este un algoritm de clasificare ce 

îşi propune să se apropie de modelul uman. COBWEB 

recunoaşte clase de bază şi grade de apartenență la 
clase. COBWEB este un algoritm de învăţare incrementala 
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ce defineşte un număr optim de clase plecând de la un set 

de instante neclasificate. 

Clasele sunt reprezentate printr-un set de proprietati, fiecare valoare posibila 
a unei proprietăți având ataşată probabilitatea P(pi=v; | Ck) ca proprietatea p;să aibă 
valoarea vj pentru un obiect aparținând clasei ci Atunci când primeşte o instanță 
nouă, COBWEB consideră utilitatea plasării instanţei într-o clasă existentă sau a 
creării unei noi clase plecând de la acea instanţă. Criteriul folosit pentru evaluarea 
calitativă a unei clasificări se numeşte utilitatea claselor (Gluck şi Corter, 1985). 
Acest criteriu încearcă sa maximizeze atât probabilitatea ca obiectele din aceeaşi 
categorie să aibă valori comune pentru o proprietate cât şi probabilitatea ca obiecte 
din categorii diferite să aibă valori diferite ale aceleiaşi proprietăţi. Utilitatea claselor 
se calculează pentru toate clasele c, , toate proprietăţile p; şi toate valorile posibile vj 
ale acelei proprietăţi, ca: 


ddd P(Pi=Vi3) P(Pi=vi3 | Ce) P(Cu | Pi=vij) 


Maximizarea acestei sume înseamnă îmbunătăţirea modului în care sunt construite 
clasele. 

Algoritmul COBWEB este definit, pentru intrările Nod şi Instanță, după cum 
urmează: 


Cobweb (Nod, Instanta) 
begin 
if (Nod este nod frunză) then 
begin 
crează doi fii ai nodului Nod, Fl si F2; 
initializeaza probabilitățile din Fl cu cele din Nod; 


initializeaza probabilitățile din F2 cu cele din 
Instanta; 
adauga Instanta la Nod, modificând corespunzător 
probabiltatile; 
end; 
else 
begin 
adauga Instanta la Nod, modificând corespunzător 
probabilitățile; 
for ( fiecar descendent D al Nod) calculează 
utilitatea claselor obținute prin includerea Instanță 
in D; 
fie Sl scorul obținut de cel mai bun set de clase 
Dil 
fie S2 scorul obținut de al doilea mai bun set de 


clase D2; 


fie S3 scorul obținut dacă am plasa Instanta într- O 
clasă nouă; 
fie S4 scorul obținut dacă am reuni D1 şi D2 într- un 


set de clase; 
fie S5 scorul obținut dacă am înlocui Dl cu fii săi; 
end; 
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if ( S1 este cel mai bun scor ) then 
Cobweb (D1, Instanta); 
else 
if ( S3 este cel mai bun scor ) then 
initializeaza probabilitățile din noua clasă cu 
cele din Instanță; 


else 

if ( S4 este cel mai bun scor ) then 

begin 
fie Dn setul de clase obținut prin reunirea 
Dl şi D2; 
Cobweb (Dn, Instanta); 

end; 

else 

if ( S5 este cel mai bun scor ) then 

begin 
înlocuieşte D1 cu fii săi; 
Cobweb (Nod, Instanta); 

end; 


end. 


Algoritmul face o căutare in spaţiul taxonomiilor posibile folosind utilitatea 
claselor pentru a evalua şi selecta seturile posibile de clase. Iniţial, pleacă cu o 
singură clasă cu probabilitățile primei instante primite. Pentru fiecare instanţă 
ulterioară, algoritmul parcurge arborele de clase (format iniţial dintr-o singură clasă) 
şi evaluează cel mai bun pas, dintre variantele: 

- adaugă o noua clasă formată din instanţa noua; 

- adaugă instanţa noua la clasa existentă la care se potriveşte cel mai bine; 

- reuneşte două clase existente în una singură şi adaugă instanţa la clasa 

rezultată; 

- înlocuieşte o clasă existentă cu fiii ei şi adaugă instanţa la clasa rezultată 

la care se potriveşte cel mai bine. 

COBWEB este un algoritm eficient ce produce taxonomii cu un număr 
rezonabil de clase. Prezintă tendinţa de a grupa instanţe în clase de bază, şi datorită 
utilizării probabilităților, acceptă noţiunea de grad de apartenenţă la o clasă. 


6.5. Concluzii 


Învățarea automată tradiţională se bazează pe un model conceptual raţional 
al lumii fizice. Pe baza acestui model s-au obţinut structuri de reprezentare tot mai 
complexe, strategii de căutare mai eficiente şi progrese semnificative atât în crearea 
unor sisteme ce simulează aspecte ale inteligenţei biologice, cât şi în înţelegerea 
modului în care funcţionează inteligența umană. Ideea unui model conceptual 
rational al lumii fizice se bazează însă pe tradiţia filozofică rationalista, care însă nu 
modelează şi felul în care rationeaza inteligența biologică. Inteligența umană are la 
bază atât raționamente logice şi ştiinţifice cât şi raționamente empirice, esenţiale mai 
ales în interpretarea necunoscutului. 

Acest lucru a dus la crearea de noi metode de modelare a inteligenţei, cum ar 
fi rețelele neuronale şi algoritmii genetici, sau la includerea unor raționamente 
empirice similare celor umane în algoritmi de învăţare mai tradiționali. Rezultatele 
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semnificative date de aplicarea acestor noi idei promit crearea unor sisteme tot mai 
inteligente, până la crearea primei inteligente artificiale reale. Probabil, prima 
inteligenţă artificială veritabilă nu va fi creată de programatori umani, ci de un sistem 
artificial ce va învăța să fie inteligent observând instanțele date de rationamentele 
umane. 

Metodele învăţării automate au devenit instrumente de bază în 
implementarea sistemelor complexe de inteligenţă artificială. Există numeroase 
centre de cercetare şi conferințe anuale având ca principal domeniu dezvoltarea şi 
evaluarea metodologiilor de învăţare automată (vezi bibliografia). Tendinţa generală 
de a crea sisteme informatice tot mai independente şi adaptabile face studiul 
Invatarii Automate unul dintre cele mai atractive domenii de cercetare în Inteligenta 
Artificială. 

Datorită limitărilor de spaţiu, acest capitol prezintă doar o parte din algoritmii 
de învăţare existenţi, având ca scop doar atragerea interesului cititorului pentru 
documentare suplimentară în acest domeniu. 


Cerinţe pentru studenți 
e Să fie familiarizați cu cel putin două metode de învățare automată (dintre care 
una — ID3). 
e Sa poate recunoaste cele mai indicate metode de învăţare aplicabile unei 
probleme reale. 


Probleme 


P6.1 Dati exemple de aplicaţii pentru care învățarea automata nu poate fi aplicată în 
practică. Explicati. 


P6.2 Daţi exemple de metode de învățarea automată pentru fiecare din categoriilei: 
e învățare supervizată, fără surse de cunoaştere 
e învățare supervizată, cu surse de cunoaştere 
e învățare nesupervizată 


P6.3 Un supervizor dă scoruri pentru stările unui joc de şah (situaţia de pe tablă la un 
moment dat). Un program de învățare poate recunoaşte mutările optime la un moment dat, 
alegând cea care duce la starea cu scor maximal. Dacă însă programul de învăţare nu ar 
dispune de exemplele de antrenament, cum ar putea învăța mutările optime? 


P6.4 Pentru construirea unui set de exemple de antrenament putem genera stări ce vor fi 
evaluate de un supervizor, urmând una din metodele următoare: 
e se generează la întâmplare o stare legală a pieselor de pe tabla; 
e se generează o stare plecând de la alta deja evaluată, din care se execută o mutare 
legală 
Care din cele două metode este mai eficientă (în sensul maximizării stărilor 
relevante pentru învăţare — cu câştig maxim de informaţie). 


P6.5 Construiţi arborele ID3 pentru instanţele de antrenament din tabela 6.2. Apoi repetati 


pentru învățarea conceptului de umiditate, în loc de optim ski, utilizând atributele 
corespunzătoare din instanţele de antrenament. 
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Tabela 6.2 Instate de antrenare pentru exercițiul 6.5 


Zi prognoza |cer temperatura umiditatea | vântul Optim ski? 
1 optimistă | senin cald mare slab nu 
2 optimistă |innourat cald mare puterninc  |nu 
3 neutră înnourat cald mare slab da 
4 proastă senin optim mare slab da 
5 proastă senin frig normală slab da 
6 proastă senin frig normală puterninc  |nu 
7 neutră senin frig normală puterninc |da 
8 optimistă jinnourat optim mare slab nu 
9 optimistă | senin frig normala slab da 
10 proasta înnourat optim normal slab da 
11 optimistă |innourat optim normala puterninc |da 
12 neutra senin optim mare puterninc |da 
13 neutră senin cald normală slab da 
14 proastă înnourat optim mare puterninc  |nu 


P6.6 Construiti arborele ID3 pentru descrierea funcţiei: 

(A*B) xor (CvD) 
P6.7 Daca A1 şi A2 sunt arbori de decizie şi A2 îl conţine pe A1, poate fi A2 rescris ca un 
arbore format din A7 şi un alt arbore de decizie A3 ataşat la una sau mai multe noduri 
terminale din A1? Explicati şi dati exemple. 


P6.8 Dati o soluție mai rapidă decât ID3 pentru învățarea automată a unor reguli de 
clasificare pentru instanţele din tabela 6.2. 


P6.9 Ce poate fi învăţat aplicând EBL pentru instanţele de antrenament: 


Iaşi (aproape (Botoşani), aeroport (da), drum (Botoşani)) 
Botoşani (aproape (Iasi), aeroport (nu), drum (Ilaşi)) 


şi baza de cunoştinţe: 

A: drum (B) ^ aproape (B) => condus (A, B) 
A: aeroport (da) => zbor (A, any) 

condus (A, B) 1 zbor (B, any) => zbor (A, any) 


P6.10 Descrieti o metodă de a reformula automat conceptul ţintă pentru un algoritm de 
învățare supervizat în cazul insuficientei datelor de antrenament. Exemple. 
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